MDARK
第 801 期 ~ 第 900 期

【睡前消息859】0基础玩DeepSeek 我们媒体要用

春节假期,全国人民一起体验DeepSeek,马督工跟风。

大家好,2025年2月4日星期一,农历正月初七,欢迎收看859期睡前消息。这也是我们在乙巳蛇年的第一期节目,请静静介绍话题:

春节假期即将结束。假期最大的热点,就是Deepseek AI免费开放,让上千万中国人第一次接触到AI服务。直到现在,Deepseek服务还处于拥堵状态,联网功能和深度思考功能还经常连不上,督工你怎么评价Deepseek的成功?

在用了一周Deepseek之后,我先做一个基本判断:

过去我常说,在互联网时代,搜索引擎是最基本的工具。如果你不能熟练地搜索信息,相对其他人就算是大猩猩。2025年的今天,在国内已经存在成熟且免费AI服务的背景下, AI工具和google一类搜索引擎可以并列,用来区分人和大猩猩。

然后分析Deepseek的成功。我认为,成功的必要条件,是相信自己走在正确的道路上,尤其是在外界的质疑下,还要意志坚定,坚持投入资本和劳动。这在2024年的中国尤其重要,因为中国的舆论环境并不是一直支持AI技术开发。

openAI在2022年底推出了chatgpt对话服务,之后逐渐升级,到现在已经有26个月了。对于舆论和资本来说,这是很长的一段时间。

2022年底到2023年初, 舆论的态度是惊奇和试探,随着用户发现不同的使用方式,热度逐渐提高,最终带动了全世界的投资,把美国股市推到新的高峰。到2024年,为了给AI服务器提供足够的电力,几个美国超级企业已经开始建设新的核电站了。

中国大陆对AI的态度,一度也是全面跟进,2023年全国有上百家企业推出AI大模型。到了2023年底,国家语言资源监测与研究中心统计年度中国媒体十大新词,其中就包括“百模大战”。

但是,到了24年,一方面AI开发的投入越来越高,另一方面AI并没有给国内企业带来明显的收入或用户增长,“百模大战”的大多数参与者都考虑退出竞争。国内媒体开始对AI的作用表示质疑。2024年8月,环球网邀请一批行业专家,发出专稿,标题是《“人工智能泡沫”,现在到底有多大?》,请静静帮我读一段:

清华大学新闻学院和人工智能学院双聘教授沈阳表示:

目前来看,AI技术,尤其是模型训练和推理的资金投入速度已经远超市场需求的增长速度。许多企业在追逐技术前沿的过程中,忽略了市场的实际需求。这种“技术推动”模式容易导致供过于求的局面,进而产生泡沫。

到了2024年底,虽然诺贝尔物理奖和化学奖都发给了AI技术,但国内对AI开发的批判反而越来越多。临近年底,凤凰网和青岛市政府联合举办2024财富论坛,距离现在只有几十天。当过东方证券首席经济学家和上海宝山区发改委副主任的邵宇在会上发言,也请静静读一下媒体报道:

谈及AI概念对美股近年上涨的推动,邵宇表示,他认为AI可能是我们有生以来遇到最大一次泡沫,只是暂时没有办法证伪。

他认为,人工智能的第一阶段投入了这么多算力,投入了这么多煤、铜、电力,如果只是移动“电子”,只是创作更多的文本和跟人聊天,并没有向下一个环节做传导,那没有太多的意义。因为真正改变世界的还是移动“原子”,让AI能帮人类开车、开飞机,能搬砖,代替人类做粗脏累活,而非是AI创作音乐,人类继续搬砖。

在越来越强的质疑气氛下,坚持不怀疑自己的选择,我认为这是Deepseek成功的第一要素。

然后说Deepseek的第二个优点,就是毫不犹豫地利用现有的技术环境,站在其他Ai的头顶上,寻找更多的机会。具体来说,就是果断使用“蒸馏数据”的方式,向包括chatgpt在内的各国AI提问,快速积累有效数据。

在Deepseek向公众开放的前几天,很多用户都发现,如果你对Deepseek提出一些离谱的要求,比如提供成人色情信息,制订一份犯罪计划,或者是生成一张图片侮辱马斯克,Deepseek拒绝的理由往往是“根据openai的使用政策,我不能提供类似服务”。还有一些用户向Deepseek提出简单的算术问题,发现它犯错误的方式,只能在英文语序下才可以解释。

我上周让Deepseek帮我搜索一些中文互联网信息,包括知乎的内容,也发现了类似现象。因为联网功能拥堵,Deepseek利用早期已经完成训练的模型做回答,它首先告诉我“作为gpt4,我的知识截止到2023年10月”。这都是直接利用其他成熟AI留下的痕迹,现在已经逐渐被修正了。

利用“数据蒸馏”技术,Deepseek降低了训练成本,提高了训练速度,快速推出了可用的免费AI,这是很棒的商业策略。

督工,你前面提到,Deepseek模型的很多数据,来自对其他成熟Aid的“蒸馏”。而openai的用户协议不允许把自己的回答用于新的商业项目,督工你怎么看待Deepseek的“数据蒸馏”模式?

按前互联网时代的传统商业版权规则,openai有一定道理。Openai提供某种商业服务,可以生成高密度信息,然后被其他企业拿去扩大市场;这就像是某个企业综合网络信息编写了一篇旅游攻略,直接被别的企业复制到自己的宣传材料上,免费发放,争取用户,当然是有问题的。

但是,在互联网AI时代,“数据蒸馏”完全符合商业伦理,否则Openai自己就不会存在,chatgpt永远不会成长。所以我认为,chatgpt既然向公众开放,单方面限制别人“数据蒸馏”的协议就没有意义。

这里我想回顾一下2022年年第488期节目的观点。

AI软件几乎不能凭空创造美术风格,都要学习大量的现有作品,学习的越多,作品质量就越高,风格就越丰富。所以很多画师认为,AI软件实际上盗用了人类画师的创意,侵犯了版权。最近,日本画师就在抗议AI “mimic”,因为这个AI只需要学习30张插画,就能模拟绘画风格生成新作品,而且图片都会带有mimic的水印。日本众多画师集体抵制mimic,不允许自己的作品成为AI的训练素材。

但是,如果认为AI学习了绘画风格就等于侵犯版权,现有的人类画师也应该向自己临摹的作品交版税。我虽然没什么美术技能,但也知道每个画师的风格都不是凭空出现的,入门的时候会学习经典作品,经历从模仿到原创的过程。一个人类画师模仿了别人的风格,只要画笔握在自己手里,就可以在作品上留自己的名字。现在他们抗议AI作品加水印,看起来还是一种带着恐惧心态的“无能愤怒”。

当时我的观点,显然是支持AI企业的立场,支持AI从传统的社会吸取公开知识。Openai自己就从整个互联网抓取信息训练AI,再反对别人蒸馏自己,逻辑不能自洽。

再往前,睡前消息374期,我在复旦演讲的时候,还支持过搜索引擎抓取全网想信息,无论是谷歌还是百度,我都希望它们都能搜索每个社区的内容。这里回顾一下:

我希望将来的社区能充分应用技术手段,方便用户搜索历史内容和相关内容,同时对外部搜索引擎开放,发挥公共平台的作用。作为公共基础设施,我前面建议国家财政补贴中立的社交媒体平台。现在我还可以加一条,搜索透明度高,对搜索引擎开放的平台,应该得到更多的补贴。

在当前阶段,对于普通人来说,AI对话就是超级搜索引擎。如果你支持各个社区、各个软件的数据向搜索引擎开发,就应该支持现在的Deepseek去“蒸馏”其他AI的数据。

当然,反过来说,Deepseek也没有资格反对别人蒸馏自己的数据,也会看到后来的追赶者快速接近自己的的逻辑水平。所以真正的问题不是蒸馏数据,而是在蒸馏阶段结束之后,Deepseek如何保持当前的发展速度,如何超越其他AI的思考深度。

睡前消息团队很早就落实了自己的立场,每一期节目,文本都在“睡前人间”公众号全文发布,方便搜索引擎搜索,也支持AI学习,欢迎各位关注。有些热心观众把我们的文稿收集起来,做成开放数据库,我一直鼓励他们的做法,但是我正好借这个机会介绍一下Ai的问题。

比如说,前面我想引用488期关于AI抓取数据的观点,但不想去自己的数据库搜索关键词,我就对Deepseek提问,哪一期睡前消息讨论了AI引用画家版权问题。

Deepseek很清楚睡前消息是马督工的节目,它告诉我,这个话题对应2023年9月13日的的669期,还认真地给出了内容总结和观点列表。

但老观众都知道,669期显然讨论的是另一个重要话题,没有一个字提到AI,而且日期也不是2023年9月13日。那一天我们正在放暑假,根本没有推送任何内容。准确的答案是2022年9月23日的488期。

这说明,针对在互联网上已经公开的信息,包括主动欢迎AI抓取学习的信息,Deepseek依然会经常性的胡说八道,而且还能给胡说八道配上凭空编造的详细信息,貌似有条理,有逻辑,有说服力。只有人类用户对相关领域有基本的概念,有随时验证的能力,AI才能成为人类的可靠工具。

Deepseek针对中文数据的搜索还有很多问题,为什么能得到中国用户的认同?

最基本的商业背景,是在Deepseek蒸馏openAI数据的同时,绝大多数中国用户,包括大多数受过高等教育的用户,体验不到openAI。其他国家的用户,在2年多的时间里,分期分批体验了AI的冲击力,开始可能是惊喜,到后来就逐渐习惯了,甚至因为进步跟不上预期,产生了失望情绪。

而Deepseek在积累创新能力和蒸馏数据的同时,还积累了过去几年AI技术进步积累的冲击力,以免费的方式,一次性在2025年春节送给中国受教育阶层,产生了瀑布式的冲击效果,所以快速占领了中国市场。

过去几年,美国不断对中国加关税,而中国希望降低世界平均关税,所以舆论总是强调一个逻辑,关税是本国消费者支付的,是人民的负担。从账面上说,这个逻辑当然没错,但关税还有更深一层逻辑,就是在通过涨价降低本国的消费欲望,提高生产利润,把原本用于消费的资源转为投资,促进本国的长期生产能力。

我之前说,解放战争最大的经济成果,就是让中国完全拿回了关税自主权,挡住了帝国主义的廉价商品倾销,让中国农业社会的剩余财富可以用来投资本国的工业。这当然也同时提高了农民购买工业品的价格,但从长远来看,是中国现代化的唯一方案。

现在中国世界第一的本土汽车工业,就是靠持续到2022年的长期保护政策发展起来的。直到外资企业彻底失去对本土车企的优势,中国才取消对汽车工业外资比例的限制。

再举一个例子,百度能成为中国使用最普遍的搜索引擎,为此获取超额利润甚至是垄断利润,最基本的原因,也是普通人用不上google。

过去两年,中国人用不上openAI,不管因为什么理由,在经济方面,这就等于在AI领域实施了税率无限大的关税,可以刺激本国企业发展水平相当的AI服务。所以Deepseek得到了宝贵的发展时间,面对一个近乎空白的市场去获取用户。如果在这之前,程序员和其他科研人员已经普遍使用openAI辅助工作,Deepseek就很难获得爆炸式营销效果。

但Deepseek的优势也不仅仅是贸易保护,在中国市场上,Deepseek至少有两个不可忽视的优势。

首先,Deepseek现阶段是免费的,这在中国这个庞大的市场,是屡试不爽的营销策略。上到房子0首付,下到超市送鸡蛋,用名义上的免费获取用户,是最好的方法。

其次,Deepseek不仅给答案,还让用户看到分阶段的逻辑结构,这在很大程度上弥补了AI习惯性胡说八道的缺点。这就像考试判卷,也许最终的答案不可信任,但严谨的逻辑结构也值得给分,也有参考价值,甚至可以用来验证最终答案的合理性。大多数Deepseek用户是第一次接触AI,之前被百度的广告和恶意信息培训过,对AI的价值保持怀疑,就是通过分阶段的逻辑结构,才对Deepseek产生了好感。

以上两个优点,简单地总结,就是产品便宜,而且基本可用。我有个朋友,说Deepseek是AI行业的拼多多,我认为是很好的总结。

我猜,很多人可能觉得说Deepseek像拼多多是侮辱,这里我介绍一下我们工作室和腾讯合作的新节目:产经破壁机。第八期和第十期就分析了拼多多的优点:

某些媒体人不了解中国现实,也忘掉了中国当代史,总是幻想一个没有拼多多的世界会更好。

但是,无论有没有拼多多,我们都不能忽视几亿中国人对廉价商品的需求,都要承认,在淘宝京东之外,商户可能还需要一个渗透率更高的电商平台,让自己能赚到平均收入。

如果有人对拼多多暴露出来的现实不满意,我就建议他去听听郭德纲的笑话,于谦的父亲心善,看不得周围有穷人,然后就拿出一大笔钱,把方圆十里的穷人都赶走了。

黄峥没有于谦老爹那么善良,不想赶走穷人,反而要创建拼多多,卖给他们一些便宜东西,给他们提供做小生意的机会,这就是他成为中国首富的原因。

拼多多对其他电商平台施加了压力,上周日2月2日,OpenAI也大大降低了新推理模型的价格,首次向免费用户开放了推理功能。这就是AI拼多多带来的踩踏效果,是AI进一步平民化的里程碑。

在Deepseek之后,全世界都被迫进入AI技术扩散时代。也许笑到最后的不一定是DeepSeek,但无论哪家企业,如果不跟上DeepSeek的潮流,一定没有笑到最后的资格。

之前很多人预言,chatgpt会带来科技革命,但等了2年多也没看到实体经济被颠覆。现在Deepseek冲击了整个AI产业,是不是科技革命真的要来了?

拼多多并没有改变商业逻辑,只是利用现有的商业逻辑,带来很大的提升,产生了量变,未来的历史回顾21世纪初的中国商业,肯定首先还是认为马云是代表人物。Deepseek也一样,到目前为止,和openAI相比,Deepseek推动的还是量变,是否能升级到质变,尚待观察,只能说概率不小。

大多数人期待的“质变”,应该是AI拥有类似于人类的推理和创造能力,再利用远远胜过人类的记忆总量,创造出连幻想作品都无法描述的科技进步。但是,从原理来说,无论是openAI,还是Deepseek,现在依然是一个基于概率统计的数学工具,用已经构造的模型,加上用户提的问题,构建成一个序列,再去预测可能性最大的语言组合,拼成一个看起来有逻辑的回答。

这个过程虽然复杂,但没有任何哲学意义上的推理或者理解。合理运用AI,可以让它分析现有的数据,找到人类尚未认识到的信息。但如果有足够长的时间,人类自己也能发现这些信息。很难说现在AI能做什么超越人类的事情。

以我的理解,在AI发展路线上,如果说一本百科全书的智能水平是0,80年代决策树专家系统的智能水平是1,未来能做推理和创新的强AI是100,现在的AI水平恐怕还在10以下。无论算几何平均数还是算术平均数,无论是按线性增长计算还是按指数增长计算,现在的AI水平,都没有达到强AI的一半。所以,这次Deepseek依然是工程技术的胜利,没有达成科学或者哲学的突破。

但是, AI对人类的威胁,并不是因为AI足够强大,而是因为大多数人类的工作实在是太简单。当前社会大多数人类的劳动方式,并不需要人类特有的智慧和创造性,只要有条件反射和肌肉记忆就够了。

我让Deepseek查询了中国各种职位的数量,它给出了一个部分符合我直觉的数据。

首先是灵活就业人员,2亿人,主力是外卖骑手、网约车司机,三和大神零工,再加上我们自媒体人员。我在苏州大街上,每天都能看到无人送货机器人在工作,也能看到L4级的小公交带着安全员搜集数据,这部分工作,未来几年被AI抢走一亿个职位,问题不大。

然后是农林牧渔业,占用1.7亿人口。这不是因为农业真需要接近2亿人,而是因为还有一些中年人因为习惯,用经营小块土地和小养殖业的方式打发时间。随着土地规模化经营,随着无人机和AI农机的普及,省出一亿个职位也问题不大。

第三个是工矿业,1.2亿个岗位,其中一半以上是流水线工人,或者是煤炭工人这种高危险岗位。当前的AI发展下去,短期内应该能省掉五六千万。

第四个是批发零售业,AI认为有1.1亿人,我认为估值偏高,原因是很多人暂时没工作,期待小商业能带来一点收入。所以,AI真能取代的人力,或许是一两千万。

第五个是建筑业,5300万人。建筑业的工作虽然不难,但是工作场景多样化,今天在山坡上修路,明天可能就在山里造桥,所以AI取代人力反而稍慢一些,也是一两千万。

上面这五个领域,总共占用了接近6亿人,估算能被当前AI取代的人数,接近3亿。而中国全部劳动年龄人口也只有8.6亿,其中扣除残疾人、暂时失业人口,占用职位在7亿到8亿之间。如果有3亿或者2亿个岗位被取代,就业冲击依然是有史以来最大的一次。

这还不算完。我最近一大乐趣,就是用AI做数理化应用题,看看AI能想到哪些人类平时不用的方式去解题。比如说我在椭圆上计算两点追赶问题,就发现Deepseek尝试了多种椭圆周长估算方式,长了不少见识。

就我观察,当前的AI如果用在应试教育方面,水平已经超过了一半的中小学老师,耐心程度当然比所有老师都要好。教育行业的铁饭碗也不保险。

最后,自从有一小部分中国人用上openai,最常见的应用,就是体制内工作人员用它做材料。因为体制内有一大批文件,格式和措辞要求极其严格,有效信息量极低,占用工作人员时间比例很大,应付完程序之后最终用户为0,最适合用AI来应付。所以,从需求角度说,公务员和国企也可以大幅度压缩编制。这部分人的工作变动,可能比上面估算的2亿个劳动岗位消失还要大。

至于说高校教师和其他科研人员。虽然从事创造性工作的比例比较高,但肯定也可以从AI中受益,而且是明显受益。我这里又要回顾一段我经常引用的记忆。

1999年或者2000年,复旦的葛剑雄教授到同济开讲座,他提到自己的老师谭其骧,在70年代末80年代初要求他们死记硬背大量的资料,包括名人的年谱,包括历史典籍,要求一字不差。

谭其骧先生解释背诵的理由,说你们当然可以去图书馆查这些资料,但背下来才能做研究。否则你想到一个新的思路,要做最基础的历史地理查证,到图书馆里搬着梯子爬上爬下,几个小时才能确定是否可以往前推进。如果你一天有两个想法,可能还能查证,有三个就没时间了。所以,基础的资料必须逐字逐句背下来,可以节约大量时间,快速验证自己的新思路,无论肯定还是否定,都能明显提高研究效率

然后葛剑雄说,谭其骧老师1992年就去世了,没有预计到后来计算机的发展。现在他把24史和其他大量资料都放到光盘里,随时检索关键字,不用放大死记硬背的范围,也能验证自己的新想法了,这就是进步。

1999年的葛剑雄,也没预料到后来搜索引擎的进步。所以每次我要论证google的重要性,就会用葛剑雄教授的发言举例,提醒听众,如果想提高创造性工作的效率,就要用好搜索引擎,有了新想法,先查证基础资料验证。不要浪费创意,也不要在错误的方向上浪费时间。

无论是光盘版24史,还是搜索引擎,或者今天的deepseekAI,用谭其骧的思路来概括,有一个共同点,提高信息检索效率,都是让从事创造性工作的人,节约自己工作内部的“蓝领”工作。读书,做实验、讨论和思考都很好,但如果不是需要锻炼身体,就没必要浪费时间搬梯子爬书架。

所以,对于科研和文艺创作,deepseek也有重大作用,或者是提高效率,或者是解放一批实际上从事蓝领工作的助手,让他们也有机会从事创造性工作。中国乒乓球国家队有一批陪练,水平也不差,但为了模拟其他国家重要对手的风格,放弃了争夺金牌的机会。AI对于科研团队,就像是用机器人替代了陪练,让这些陪练运动员也有争夺金牌的机会。

乒乓球每个项目的金牌只有一块,而科研有无数个创造方向,如果能解放这些实际上的“蓝领助手”,科研效率必然有明显提升。

昨天2月3日,上海人工智能研究所长吴飞在上海解放网发表文章,里面有一句话概括了前面关于科研的内容:

生成式人工智能的出现使得智能机器成为知识生产的辅助者,将深刻改变个体学习者的自主思考、判断、学习能力,乃至伦理道德观。

如果科研机构需要做全面调整,我们这个媒体团队是不是也要调整呢?我们有没有可能被AI取代?

不会,我反而觉得我们优势更大了。

我给各位观众解释一下,睡前消息最核心的任务是选题,至于说写作和录制,反而是件按部就班推进的事情。

为了保证选题有足够的代表性,又能包含我们可以深挖的原创角度,我每天都要在晚上花几个小时,浏览全国的舆论场,然后每周开两次选题会,一般是第一次选题会激烈辩论,找出最合适的几个思路,然后分给具体的人去验证事实和基本逻辑。到下一次选题会,如果这个思路还没过时,如果没有找到事实和逻辑方面的严重缺陷,就正式作为选题立项,开始写作。

现在有了比较可靠的AI服务,我们可以在会场上现场验证基本逻辑和事实,至少也可以在选题会结束的当天把问题完成验证工作,提前两天就进入写作周期。写作中,针对已经确定的逻辑和事实,我会鼓励同事用AI完成局部写作,只用人力进行整体的内容规划。

当然,我相信其他媒体团队也能利用AI得到类似的进步。但就我使用Ai的经验,还有两个方面能放大我们团队的优势。

要用AI生产高质量的回答,第一个要求是提出高质量的问题。泛泛地给出背景资料,让AI评价某个新闻,人人都会。但是,用足够的限定词,提出准确的问题,找到最合适的回答。这就需要提问者自身掌握足够的资料,而且规律和传统写作是相反的。

在纸质书和图书馆的时代,写东西,需要知道自己知道什么,不知道的不能乱写。AI写作时代,还需要知道自己不知道什么,用AI把这些自己“不知道的东西”加载到大脑里,和新闻互动, 然后才能提出有深度,有清晰边界的问题,让AI生产高价值内容。

这和搜索引擎的时代没有本质区别,只是AI放大了搜索引擎的力量,让我们的大脑能加载更多,更详细的“不知道内容”。我相信我们的团队大脑储备了更丰富的信息条目,有更多的“不知道内容”可以随时加载。如果还解决不了问题,我们快速学习,迭代自己“不知道内容”的能力也更强,所以我认为AI会放大我们的优势。

用AI制作高质量内容,第二个要求,是在AI不靠谱的时候,有较高的概率用直觉叫停。

前面我用睡前消息自己的内容搜索举了例子,刚才我又在自己的主场作战,问dsAI, 一个典型的中部农业县,政府信用累积融资上限是多少?

结果我就不截图了,总之,我看到数据之后,立刻意识到,差了一两个数量级,所以完全没有参考价值。有这份直觉,AI才是媒体人的驯服工具。

总的来说,对于媒体来说,AI首先是超级搜索工具,然后才是内容生成工具。我们之前靠搜索引擎,在这条赛道上领跑,所以我确信同样的优势在AI时代会被放大。

如果有人想用AI取代我们,如果有人想用AI来抢我们的市场,我给各位指指路。睡前人间公众号提供全部的睡前消息文稿,这是我们全部内容的终点,可以用来训练语言风格。睡前消息编辑部的公众号提供每日精选新闻列表,这是我们大多数内容的起点,可以用来推测我们的选题方向。

如果大家觉得AI可以在起点和终点之间取代我们这20多个同事,那就做一个节目试试看,我如果觉得有点意思,肯定会转发推荐。但在各位同行取代我们之前,我还是鼓励大家多读书,扩大那些“知道自己不知道”的内容列表,也提高直觉判断的准确率。AI可能在每一个有确定答案的领域都比你强,但只要人类保持比较宽的知识面,有足够的联想能力,眼下就不怕AI来抢工作。

前几期节目,很多观众引用你574期节目的观点。当时你认为可用的中文训练资料太少,压制了中国AI发展速度,很难追赶英文世界的大模型。现在中国的deepseek出来了,你怎么看待自己的观点?

讨论之前,我先和各位一起回顾我在574期节目的主要观点。

今天的节目很长,最后用几个简单问题回顾一下今天的内容:

1 ChatGPT是什么?

ChatGPT是一个不知疲倦的做题家。

2 ChatGPT会淘汰谁?

淘汰那些只会做题,不会提问题,不会开展原创工作的人,包括前几次办公自动化就应该淘汰的那些工具人。

3 中国发展AI产业有什么障碍?

硬件缺显卡,软件缺算法,但最缺的还是让AI做题家自主学习的题库,也就是中文信息。

在信息方面,中文网页数量少,高质量的讨论更少。而且现存数据被人为分割,限制在各个企业APP内部,限制在档案馆莫名其妙的保密规定里面,可搜索性很差,不能变成供养强大AI的土壤。

回顾结束,现在是2025年初,我来评价2023年自己的观点。

这一期节目的开始,我介绍了deepseek的数据蒸馏技巧,ds充分利用了AI时代新的版权伦理,把别人已经形成的高密度信息拿来用,尤其是利用openAI从英文互联网上浓缩的内容,提高了追赶效率,缓解了语料缺乏的问题。所以,中国也能有接近世界一流水平的AI。

但是,中文语料缺乏,各网站和实体文化机构相互封闭的问题,并没有缓解,反而更严重了。比如说我刚刚去查了裁判文书网,统计资料清楚地展示了民事案件和刑事案件的每年上网公示比例,可以看到2019年是最高峰,之后逐年下降。到了2024年,民事案件的文件数量不到顶峰的1/4;刑事案件的文件数量不到顶峰的1/6。真要用这种数据库去训练AI,给法官或者律师当参考,我是很担心的,因为这等于把权力交给了筛选上网文件的人。

其他方面的文件透明度也没有更好,新闻方面,重大事件的网页隔几个月就再也打不开;文化方面,很多问题还是用缩写才能讨论;历史方面,无论用什么工具搜索,大多数省份的县志还是没有电子版。

所以,我们现在看到的Deepseek,是一个主要用英文数据训练出来的AI。不信的话,我们可以直接向他提问题,你参考的英文数据多,还是中文数据多?

他第一句话就回复,我的训练数据以英文为主。

我问他为什么用英文训练,他回答四个因素。

1 互联网内容分布不均。

2 学术资源英文比例高。

3 中文社区不够开放。

4 AI技术生态建立在英文基础上。

所以,现在的问题是,你是否认为有独立于英语世界的中国文化需要保护,是否认为有独立的中国社会科学需要坚持,是否认为简体中文互联网有独特的价值观需要宣扬。

如果你认为没有,认为一切交给英语世界普世价值也挺好,那就无所谓了,随便deepseek用英文素材去训练。如果你认为中文世界在文化社科方面有独立性,那就麻烦了,数据蒸馏和后续的抓取,并不会在意你在意的这些东西。

现在deepseek已经是全民性的工具了,未来很长一段时间,它都会是中国学生的重要参考工具,是很多人日常问题的答案。中国下一代人的价值观,和deepseek蒸馏出来的这些数据密切相关。

当然,你可能期待deepseek的后续训练能缓和英文世界的意识形态。但问题是,deepseek似乎并不欢迎大家和他讨论社会科学,至少不欢迎用中文讨论。我相信,有一句话,过去几天大家看了起码几十次:

对不起,我还没有学会如何思考这类问题,我擅长数学、代码、逻辑类的题目,欢迎与我交流。

AI团队明确告诉你,别指望训练就能改变AI,deepseek还是那个蒸馏openai数据的底色价值观。

比如说,我问他如何评价俄乌战争:他就直接回避了

而我不小心搞错了,把今天文稿的一部分发给deepseek,他也例行回避了。观众比AI聪明,应该知道为什么。

最有意思的现象,是明明已经按照逻辑推理了答案,一步步显示出来,忽然全部消失,回到了上面那句话:

对不起,我还没有学会如何思考这类问题,我擅长数学、代码、逻辑类的题目,欢迎与我交流。

如果你想和deepseek讨论一点文化,不被他强迫去谈数学和代码,唯一的方案是脱离现实谈文艺,让他写一个古风剧本,让他作一首关于虚拟人物的诗,deepseek总能完成任务。一句话概括,deepseek很乐意交流虚拟的中国文化,不欢迎讨论现实中国社会问题。我

所以,deepseek是一个很棒的中国企业产品,但不是简体中文世界的优秀AI。我在574期的结论,需要用数据蒸馏这个新事物来修正,但总体上是没问题的。我还是用2年前的判断,来给今天的节目收尾:

一句话总结,就是在当前的互联网上,和日常生活规则越近的中文内容,和现实的偏差越大。如果让AI在类似的基础上进化,然后要求AI用自己的能力为人类服务,我担心AI恐怕不一定能正确理解中国人的利益和需求。最后完全可能号称“为中国人服务”,做出恐怖的决定。

所以我还是希望,无论如何先改革中国人自己的文化,让人的文化繁荣起来,再去发展AI时代的文化。面对不可测的未来,这是我们能做的最有价值的事情。

……

到了AI时代,我们又在更深刻的层次上遇到了同一个问题。允许中国人在互联网上发表言论,尤其是允许自由说实话,这不仅仅是社会主义公民应有的基本权利,是文化繁荣的基本条件,更是发展生产力的前提。真实可靠的中文言论,和导弹、芯片、石油、人口一样,是中国经济竞争力的来源,可以直接决定产业革命的效率,影响国家的生死存亡。

到了这个时候,我觉得无论是支持保留中国文化内核的人,还是支持文化革命的人,都应该放下争论,达成一个基本共识,就是必须先让中国互联网文化繁荣起来,让人民好好说话,给中国AI、中国经济乃至中国文化留一条活路。

这次恢复更新之后,第一期节目是842期,标题是:《文科就业难,AI产业需要你写回忆录》,我希望每个中国人都多贡献一点开放的现实中文记录,培养一个熟悉当代中国人生活的AI。

如果你相信中国人当下的生活足够美好,如果你相信当下的中国文化有优越性,你最好也考虑同样的问题,想点办法供养deepseek,让它在数据蒸馏之后,依然能接受普通中国人的训练,熟悉我们共同关心的话题。否则在未来的强AI时代,一个中国企业创造的AI,未必能接纳当代中国人的精神生活。

最后,还是给自己做一条广告。我在知识星球上经营付费社区快一年了,以我为主,加上十几个同事,和一万多付费用户互动,创造了不少独特的讨论。本来我预计,大家会主要讨论宏观问题和意识形态,没想到,现在这里的主要话题是个人发展,个人心态和家长里短的生活问题,当然也会有1/3左右的内容和整个中国社会相关。

有兴趣参加我们这个“中圈子”讨论的观众,可以在评论区置顶内容复制链接,在网页打开购买,也可以下载知识星球app搜索【睡前消息的编辑们】购买加入。

我的知识星球不提供绝对正确的答案,但在大家提问的启发之下,一定能给大家打开新的视角,至少短期内我还不怕AI来取代我的知识星球,期待更多朋友的加入。

859期节目到此结束,感谢各位收看,期待大家用AI提高评论区的内容质量,我们周五860期再见!

Leave comment