2025 年 2 月文摘
mschf ⭐
https://severedspots.com/manifesto/
https://spottingplutes.com/manifesto
https://antiadvertisingadvertising.club/
https://illegalchips.com/manifesto
https://museumofforgeriespicasso.com/
《statistical rethinking》
Statistics courses and books—this one included—tend to resemble horoscopes. There are two senses to this resemblance. First, in order to remain plausibly correct, they must remain tremendously vague. … Second, there are strong incentives for both astrologers and statisticians to exaggerate the power and importance of their advice. … What we end up with is too often horoscopic: vague and optimistic, butstill claiming critical importance.
Pride Versioning
llms.txt
警惕 LLM 懂哥
想了好久,给这段这么个比较偏激的标题。我知道最近非常多博主创作 DeepSeek 相关的内容来蹭流量,效果也非常好;另外这个话题也非常出圈,在现实生活中也经常有人提起。目前我产生了一种生理反射,听到这个词就恶心。
我目前对它的理解是这样的:
- 一家中国企业,在硬件条件受限的情况下,训练并开源了媲美闭源商业模型的大模型。这是值得称道的,确实很优秀。
- 至于开源只开了权重这件事,其实大模型的「开源」就是这样,训练数据其实跟算法本身同样值钱,加上开放出来你再训练一遍意义不大,纯浪费电。
- 其实模型功能并没有很大的创新,推理也是 OpenAI 先做出来的,如果想体验完全没必要都去挤那个 R1。另外推理也不适合全部的应用场景,慢加上成本高,并非银弹。
- 回到标题「警惕懂哥」,是因为很多人蹭着这个流量开始卖课、卖 API,但其实他们屁都不懂。什么叫懂呢,至少把上面推荐那本书说的知识点脉络串讲清楚吧,我相信大多数在卖课的人压根说不出来(甚至连「语言模型」到底是什么都不知道)。
还有一个很火的话题是「本地部署」,这个也比较扯淡,先说观点:
- 所有在消费级硬件上能部署,能跑起来的,都是蒸馏模型,简单来说就是让小参数的模型「鹦鹉学舌」,并不能反映所谓「满血模型」的实力。换句话说,就是「看起来像」,也会比模型本身好,但是 benchmark 达不到「满血模型」的水平。
- 基于上一条,所有本地部署的都是玩具级别的,如果你手头正好有闲置的硬件,可以部署着玩,但是没必要因此去购入任何硬件。
- 如果是想用于生产,更加没必要自己搭建。规模上来的时候,吞吐量会是一个非常关键的指标,需要堆很多硬件才能保证。另外,集群的稳定运行也会耗费巨大的成本。使用公有设施在成本和性能上都更优。
摸着良心,我分享几个比较合理的方式:
- 个人体验玩,首先考虑官网的网页对话;如果要 API,可以用官方的,或者用硅基流动的。(如果你不嫌弃,可以点我这个 aff 链接,硅基流动目前注册有免费的额度。)另外 OpenRouter 等现在也有,不过价格略高。
- 个人已有设备,可以尝试 Ollama 或 LM Studio 自己部署一些蒸馏模型玩玩,这些产品已经把部署做到非常傻瓜式。
- B 端接入,可以考虑硅基流动里面带 「Pro」的模型,例如「Pro/deepseek-ai/DeepSeek-V3」,是独立的通道,只能充值使用,不能用赠送的余额。好处是不怎么会出现超时的问题,免费的那个目前基本不怎么可用。
- B 端有比较高的性能或稳定性要求,可以考虑各云服务厂商的预留实例。例如 AWS 可以用导入模型,或者硅基流动也有可以商务洽谈的预留实例。这类的吞吐量和成本也不如公共服务理想。
Serving the country
What’s still here?
But it’s more interesting to be curious about what’s old. What stood the test of time? What worked before and still works now?
New will always be new. There will always be another new after the previous new. But what made it, what sticks around, what outlasts? What’s durable? What’s the reason that rare thing is still here?
人工智能的痛击
On DeepSeek and Export Controls 🖕
制度在于人心
骄兵悍将,每次拥戴一个皇帝,就能发财,有大把的赏赐,还能抢掠。 他们平时待遇估计就不怎么样,每次就等着换皇帝发财。
论门当户对 ⭐
究竟什么是“门当户对”呢?按照我的理解,它不仅指的是社会和经济地位平等的家庭之间的婚姻,而且它指的是把寻找跟自己社会和经济地位平等的潜在伴侣视为寻找伴侣的首要的驱动力。
欠缺内在性或主体性,是中国文化的一大特点,或从现代世界的角度来看,这毋宁说是一大缺陷。黑格尔说中国人欠缺人性的内在性,巴迪欧说东亚社会普遍无主体,这些话都不是没有根据的。“门当户对”的观点就是中国文化欠缺内在性的一个重要表现,因为它只是把婚姻看成是财富和社会地位这样的外在东西的结合,而没有看出这是两个主体的精神联结。
相亲的欺骗性:父母所考虑的因素并非吸引力和长期关系的重要因素
成年后还和父母住一起的女人是不能找的
平行主义
平行主义即:不要试图改变他人、改变这个社会。去寻一个适合自己的社会,如果没有,创造一个。将会有各种类型的社会并存于世。让人自由选择出最适合人类的社会制度。
On DeepSeek’s r1
当性别的坐标消失:一个属于泛性恋的 “非典型” 爱情故事
我们怎么区别一段感情是不是爱情?好像大家的心里都有许多盒子,一些感情放在名为“爱情”的盒子里,一些放在“友情”的盒子里,一些放在“亲情”的盒子里。可我没有盒子,我的心里只有一个光谱,一端是亲密一端是疏离,所有的关系都混沌地分布在同一个光谱上。
Judge Your Coworkers
避开锋芒,单点突破
实际上?外界的各种言论,都是障眼法,跟我们个人赚钱没有任何关系。你需要思考的是,自己有什么价值,自己能满足别人什么需求。哪怕一个算命的先生,我觉得都比那些谈老龄化、谈新能源、谈人工智能的人有前途。
隐说 No.4 做一个聪明的“愚人”
老子说:“大象无形,大音希声”,《周易》坤卦:“六三,不显露、炫耀才华,固守柔顺之德。即使辅佐君王,也不应居功自傲,这样才能有善终”。这些教诲提醒我们,要时刻注意自己的言行。过于聪明或恃才傲物,不仅容易遭到小人的陷害,往往也会招致不必要的攻击。
如果你不展示自己的才能,可能会一直得不到重任;而如果过于锋芒毕露,可能会招致他人的陷害。虽然这样容易获得短暂的成功,却为自己埋下了祸根。
《打,打个大西瓜》片尾 idol
Disney 万籁鸣 手冢治虫 宫崎骏 押井守 大友克洋 PIXAR 鸟山明 李安 黑泽明 余秋雨 金庸 小岛秀夫 成龙 李连杰 周星驰 易中天 于丹 胡一虎 Barack Obama Condoleeza Rice Al Core Billgates Warren Buffett 李嘉诚 马云 王石 史玉柱
梦想大的领导梦想小的
宇宙观>世界观>人生观>财富观>行业观>感情观
人类社会很简单,就是梦想大的领导梦想小的
人类社会,只有领导才能掌握话语权。而只有梦想大的人才可能当领导。因为当领导最重要的工作是画饼。而只有当员工的最重要的工作才是执行——学历只能执行工作。
隐说 No.2 教育与洗脑
禅僧把修行顿悟的过程绘制成牧童找牛图,即所谓的禅宗《十牛图》。这就是寻牛、见迹、见牛、得牛、牧牛、骑牛归家、忘牛存人、人牛俱忘、返本还源、入郦垂手十像。
在“亚逼”这词儿出现之前,琼瑶想象了一种很“亚”的生活
以批判性眼光看待父权制和资本主义,反叛但不正面抗衡,而是躺平或者出走,于是打零工、干轻体力活,相信“小事”的价值,比起“民族”、“家庭”这些更大的归属感来源,“朋友”/“同好”是更重要的社会关系,“爱情”就成为最猛烈的社会实践和最小单位的革命。
何为天道
其实我不完全赞同故事中所谓的天道,芸芸众生在这红尘中,都是身不由己,缘起缘尽,历史的长河奔涌向前,这一切都被一只蕴含天理大道的手在操控,但岂能轻易被看到。… 万物生长的自然规律才是天道
记者是文科生最好的职业起点
文科生最重要的是什么?文科生最重要的是社交资源。第一是社交资源,第二是它整合社交资源,第三是它能够在认识社交资源,整合社交资源的情况下,它还有一技之长,比如他会写作,或者他会英语,或者是他性格特别好,或者是说白了本质上是个链接资源。 而营销工作就是在链接资源,记者就是在链接资源,包括出版人也是。
这个行业它能够链接到资源,而且它能够写东西,它能够出产内容,这个是非常核心的资源,而且这是文科生非常核心的资源,因为文科生最核心的资源一个就是生产内容,还有一个是什么?还有一个就是你能认识人,而记者恰恰满足了这两点。
要解决难题应该具备的一些心态
I Am Sick of PKM ⭐
Modern technology makes it all too easy to fall into obsessions. With its sleek user interface, polished fonts, and seamless integration of multimedia, even the smallest imperfection in your note-taking app can feel like a glaring flaw.
Like an ink stain, a poorly laid-out document becomes a distraction, only different, because an ink stain cannot be erased, but you can always make your page look nicer, and thus countless efforts have been made to eliminate unimportant distracting details. Because you realized there is always going to be a better way to do this, you began to pursue a better method rather than a deeper understanding of the knowledge itself.
The harsh reality suddenly becomes unbearable to you. After you’ve experienced true perfection, it has been unacceptable to you that things are done in an ungraceful maanner, though it might cost less and produce more.
I’m not saying productivity tools actually lower your productivity. The problem is not about tools but the people using it, and the way people use it.
幸福相伴到老的秘诀是什么?
On Emergent Misalignment
It turns out that if you fine-tune models, especially GPT-4o and Qwen2.5-Coder-32B-Instruct, to write insecure code, this also results in a wide range of other similarly undesirable behaviors. They more or less grow a mustache and become their evil twin.
More precisely, they become antinormative. They do what seems superficially worst. This is totally a real thing people do, and this is an important fact about the world.
既然感受是真实的
我想说的是,个体不应该用理性来压制感性,这是反人类的,也无利于认识世界。当你感到焦虑或者害怕的时候,与其告诉自己「我不应该有这样的感受」「我的感受是没道理的」,不如问问自己「为什么我会有这样的感受」。你应该用理性来解释感受,而非用理性否认感受。 既然感受是真实的,就有讨论的必要。任何情绪和感受,简单接受和直接否认都不利于正确认识它。