新闻资讯

开元体育苇草简讯第八十二期 苇草智酷学术委员成员动态

作者:小编 点击: 发布时间:2025-02-17 10:54:37

  开元体育苇草简讯第八十二期 苇草智酷学术委员成员动态苇草智酷成立于 2017年 9 月 22 日。由长期从事互联网前沿思想、人文、科技,和投资领域的专家所组成一个的思想者社群组织,其前身是已运营  5年的互联网思想者社区—网络智酷。

  苇草简讯是围绕智酷成员,阶段性的外部活动、核心观点,以及前沿思想的汇总。小编特别整理了简讯内容,希望对互联网前沿科技、人文,以及跨界思想有兴趣的朋友能够了解与交流。

  1 月 11 日 -12 日,2025 中国自动化与人工智能科普大会暨创新人才贯通式培养研讨会在京举行。王飞跃作了题为《新 AI与新时代的人才与培养》的报告。他指出,在人工智能技术迅猛发展的新时代,各种人工智能和机器学习方法与技术正重塑各行业生产模式与工作方式,为社会带来巨大机遇与挑战。社会对人才需求发生转变,未来人才需具备跨学科综合素质、创新能力及扎实的专业知识与技能,以适应AI时代需求。教育体系亟待改革,传统模式应与AI 深度融合,培养学生的数据思维、算法意识、编程能力,强化批判性思维、创造力和团队合作等关键能力。同时,推广终身学习理念,鼓励全程学习新知识、新技能,紧跟技术与社会需求变化。

  1 月 17 日,第三届计算社会科学国际会议成功举办。罗家德以《AComparison between Chinese and American InnovativeBehaviors--Based on aCultural-Structural Approach》为题做主题分享。

  1 月 19 日上午,第一场“委员通道”开启,周涛作为四川省政协委员之一走上“委员通道”。周涛看来,发展数字经济首先要做好顶层设计,要设计一些好的政策,通过上下贯通来支持整个四川数字产业生态的建设;第二是中间层,怎么找到数据发挥巨大价值的这些场景,然后建立有必要的平台,让数据真正能够更高效地发挥价值;然后是基础层,四川到底要建什么样的数据基础设施,才能有力地支撑我们开展这些数字经济的活动。

  1 月 25 日,张 江 课 题 组 在 NPJ Complexity 发表最新研究论文《动力学可逆性与一种基于 SVD的新因果涌现理 论 》(Dynamical Reversibility and a New Theory of Causal Emergence based on SVD),文章指出,时间倒流与因果涌现存在深刻联系。智能体构建世界的模型,与其说是在追求涌现的因果,不如说在追求“时间倒流”的可能性。

  2 月 7 日,第三期“新物种”滇西野外地标科考研修营在昆明城市学院开营。开营当天岳路平担任主持。

  1 月 22 日,苇草智酷十一周年年会在东升国际科学园报告厅成功举办,本次年会主题为“新芽”,由岳路平主持,30 多位专家学者出席。

  1 月31 日晚,智酷 407 期,武汉大学计算机学院教授蔡恒进分享《DeepSeek的成就和AGI 的未来》,中国人民大学哲学院教授刘晓力、Futurelabs 未来实验室首席专家胡延平、北京大学新闻与传播学院教授胡泳、北京邮电大学人工智能学院人机交互与认知工程实验室主任刘伟点评,北京信息社会研究所所长王俊秀主持。5.5 万人次观看直播。

  蔡恒进认为,DeepSeek 的出现是AI 发展的重要转折点,它打破了传统的中心化 AI 模式,为未来的发展提供了新的方向。他强调,真正的智能并非依赖于大规模的算力和参数堆砌,而是应该追求更小的系统、更少的语料来实现更高的智能,这与生命进化中智能的发展规律相契合。蔡恒进指出,语言模型的突破已经解决了人类直觉和语言表达的科学空白,未来的关键在于进一步探索智能和意识的产生机制,以及如何让 AI 更好地服务于人类的未来。

  他还提到,人类的未来应该是在深刻理解生命、意识和智能关系的基础上,通过 AI 技术实现“life++”,即利用 AI 作为人类的分身进入元宇宙,参与未来的超级智能演变。他认为,这种分布式的发展模式才是合理的未来路径,而不是简单地将人类与机器融合。他对 AGI 的实现充满信心,认为其即将到来,并呼吁人们积极拥抱 AI 技术,将其应用于各个领域,以推动人类社会的进步。

  胡延平表示 DeepSeek 的出现虽然具有重要意义,但存在过度解读的问题。他指出,从AI 发展的周期来看,DeepSeek 处于大语言模型周期的成熟阶段,而未来AI 的发展将走向时空智能和物理现实世界的模型构建,DeepSeek 在这些方面仍有差距。他还强调,算力的节约是有限的,未来 AI 的发展仍需要大量算力支持。

  刘晓力高度评价 DeepSeek 对AI for science 和 science for AI 的促进作用,认为其低成本和小模型的特点为科学研究提供了新的可能性。她还提到 DeepSeek 在文学创作和科学研究方面的出色表现,尤其是在提供思路和文献方面的能力。

  胡泳认为 DeepSeek 的影响力远超预期,它不仅在技术上实现了推理能力的飞跃,还对硅谷的商业模式和美国的国家战略产生了冲击。他指出,DeepSeek的出现使得AI 技术更加化,降低了开发门槛,同时也加剧了中美之间的技术竞争。

  刘伟强调 DeepSeek 的出现打破了美国在 AI 领域的神话,证明了小数据、小样本也可以实现大智慧。他认为 DeepSeek 的出现将引发一系列衍生效应,包括对美国 AI 霸权的冲击,以及对国内 AI 研究和应用的启示。

  2 月 9 日晚,苇草智酷、信息社会50 人论坛、腾讯科技联合主办《再谈 DeepSeek 的成就和 AGI 的未来》线 期)。

  经济学家、横琴数链数字金融研究院学术与技术委员会主席朱嘉明,中国自动化学会监事长、中国科学院自动化研究所研究员王飞跃,EmojiDAO 创始人贺宝辉(Shrug Newton)将分别围绕《人工智能进化尺度和大模型生态一一DeepSeek V3 和 R1 系列现象解析》《回归现实:DeepSeek与 DeSci vs CeSci》《从 DeepSeek看 DeAI:人工智能技术范式的颠覆与重塑》做主题分享。本次会议由北京信息社会研究所所长王俊秀主持。23.6 万人次观看直播。

  朱嘉明认为,人工智能的发展速度远超预期,从 2017 年到 2025 年,AI 技术经历了快速的进化,尤其是 DeepSeek 的出现,标志着 AI 进入了一个新的阶段。他指出,AI 的进化不仅依赖于人类的推动,更重要的是 AI 自身的进化能力。他强调,未来AI 的发展将呈现多样性和度的特点,既有高端、创新、高成本的路线,也有低成本、大众化的路线。

  王飞跃则认为,DeepSeek 的出现具有重要的科技、商业、经济和社会价值。他强调,AI 的发展需要多样性,不能仅依赖于国家主导的举国体制,而是需要更多的自主创新。他提出了“设计 - 去中心化 - 自主科学”的概念,认为未来的 AI 将走向自主智能和组织化。他还指出,未来社会将由生物人、机器人和数字人共同组成,数字人将承担 80% 以上的工作,社会将发生范式转变,进入一个新的智能治理时代。

  贺宝辉从去中心化 AI 的角度出发,认为 DeepSeek 的低成本和开源特性将推动 AI 技术的普及和应用。他强调,去中心化的 AI 可以实现更高的灵活性和实时性,适用于边缘计算和多方协作。他提出,未来的 AI 将不再依赖于中心化的服务器,而是通过去中心化的网络实现自主运行和管理,成为一个独立的存在,而不是人类的工具。贺宝辉还认为,AI 的发展应当解放其潜力,让其成为人类的邻居,而不是奴隶。

  大年初一原本说啥也不干,除夕写到一半的这篇分析暂时搁置了一下,没想到事态发展比预期还快。原本推测的其中三个可能(数据剽窃指责、启动安全调查、指出芯片算力作假)没有隔夜老美就扔出来了。年都不让人好好过了真是,那就直接进入部分的沙盘推演。接下来事态发展的22 个可能,立贴为证(都只是可能不是事实,不过可能会有一半以上的命中率)。

  1. 这事与 23 年的流浪气球事件、某次产品发布相仿,大洋此岸认为是风口上的自然现象,彼岸紧张兮兮如临大敌,貌似过度反应实则有些情绪酝酿已久。有关方面原本尽力舒缓的空气会因此紧张,会放大、提前、加速一些问题的进程。且气球只是隔空影响,短期事件。而 AI 对老美的冲击却是实实在在,短中长期必将持续。新版中国威胁论近几个月其实明显抬头且正在酝酿和推动新一轮动作,DS 这一波正好在特朗普周期的起点与之碰撞发酵,互为燃料。

  2. 新冷战经济主战场,从贸易争端回合进入 AI 争端回合。贸易争端以终极关税收尾,AI 争端从芯片算力、数据权利、模型原理开始。AI 争端实质上既是科技战 2.0、脱钩 2.0 的发端,也是科技战2.0、脱钩 2.0 的核心,主权 AI 与AI主导权的混合体?多极世界,AI 浪潮,大洋此岸有自己要走的路,不必唯老美马首是瞻,更不必被彼岸带节奏,但在准确评估的基础上控制进程,预判彼岸的预判,把握好自己的节奏,有更智慧的成本费效比更好的博弈和发展策略,以及务实精进,是必要的。

  3. 中国背景大模型等 AI 产品技术服务全面禁绝进入美国市场,对人工智能会采取比 TikTok 类互联网服务更严厉管制政策,无论开源闭源大小体量均在禁绝之列。

  4. 用模型蒸馏也好,从模型获取数据也好,这方面监管政令与立法也会出台。安全、数据、知识产权等是藉口。OpenAI 等从数据保护角度可能采 取诉讼等方面动作,但大概率因为无法跨境执行会无果而终。从根本上美国 AI 头部企业这方面的重点会是推动政令、立法。变相蒸馏无法彻底去除痕迹,也会体现在模型 output 上,构成不利。但OpenAI 扒了整个互联网的数据也是问题,全球互联网数据是全人类几千年文明成果,几十亿现存地球人类共同形成的知识信息财富,OpenAI 为这些知识付费了吗,为这些数据取得授权了吗。“窃取”全人类、全网、亿万用户数据,恐怕是几乎所有 AI 基座模型共同的原点、 “原罪”。

  5. 联合盟友力量禁入全球市场是第二步。四五天前讨论过,当时原话是:如果 DS 这件事能起到这样的作用,让老美意识到 AI- 芯片 - 算力脱钩政策失效并且管制还不如不管制,算是 DS 有重要贡献,这事高调的收益为正,应该更高调才对。但如果 DS 这事包括 AI、智能新能源汽车、机器人等整体上成为新的中国威胁论的重要支点,起到适得其反的作用,让老美意识到更应该进一步收紧上下游更应该生态级遏制,让中国科技难以形成全球循环失去规模效应,因而高成本低收益进而影响到技术迭代能力,那么这事的收益为负。所以,核心问题是评估这事的收益,而不仅是技术水准到底如何。评估清楚这个问题的走向和得失正负,就知道到底是应该高调自信造势,还是低调务实精进。

  6. 芯片算力必然进一步收紧,这方面拜登禁令大概率不会被撤销,而且会加码到更低阶的 AI 算力卡比如 H20,观察这方面问题的一个标志,是看字节跳动能不能拐弯拿到清单上的英伟达芯片。无论芯片水进来,还是海外自建算力中心,又或者租用第三方算力中心,三条路大概率都会被堵死。中国背景的企业、大模型,最终会被外力内力一起推到国产芯片算力这条道上来,生态分岔点就在 2025,利好国产算力但国产算力必须加快迭代速度。

  7. 消费级算力卡的下限未来可能会从 RTX5090 下沉,ProjectDIGITS 可能不会在中国上市,AMD、Apple的一些消费级工作站级高算力产品也可能受限。

  8. 自研通用 GPU、ASIC 芯片的离岸代工制造,以及委托博通、Marvell 等开发ASIC 芯片以及这些芯片的海外代工,这些路径接下来可能也会被完全切断。

  9. 限制代工制造的取向,有从 AI 大模型训练推理芯片,向汽车、机器人等领域的 AI 算力 -SoC 芯片扩大的趋向。

  10. AI技术与知识产权保护方案也会有追责或诉讼等动作,相关保护政令甚至法案大概率;更进一步,AI 方面会成为中美知识产权问题交涉开元体育、博弈的焦点;这方面的实质影响,可能比蒸馏意义上的数据争端要大一点。

  11. 以上事态加速 AI 世界更进一步向两个生态体系,对国产芯片算力、国产大模型等相对有利,对国产AI 应用开发者利用老美等国 AI大模型尤其基座模型不利。因为即使科学上网,因为彼岸禁绝力度加强,注册使用账号、API都变得更为困难。

  12. 前面第 6 点说了利好国产算力,不过对国产芯片算力、国产大模型等也有不利,就是前面第 5 点说的,这事会升级,老美策略重点也在转变。会从科技脱钩转为“科技脱钩 + 生态遏制”,让中国科技难以形成全球循环,失去规模效应因而高成本低收益,市场造血机能受限,进而影响到技术迭代能力。他的生态要搞得大大的,成为全球基础设施,你的生态边界要给你压缩到小小的,彼岸要以大生态围合压制小生态。一个世界,两套生态。

  13. 开源世界走向,一个生态的开源进入不到另一个生态,高阶开源模型将纷纷主动被动收紧开放程度,主权AI 理念的国家纷纷收紧对开源模型的管制,且AGI 千后会进一步加大促使高阶开源模型走向闭源的力度。不过头部大平台,尤其是原来只做闭源的平台,也会纷纷推出开源模型。个中原因,不仅仅在于开源与闭源之争,更在于智能未来的分布形态必然是端云结合公私兼有开源闭源互补,大平台必须从模型体系角度适配未来的生态,尤其是中心化与分布式结合。

  14. 中美 AI 合作越来越没有基础,也不会真的走向深度合作。拜登周期对AI监管对齐相对重视,合作还有些基础。特朗普周期放松监管。“AI 军控”基本上会失去最重要的两个 AI 生态之间的国际协同。在人类共同挑战层面的礼貌性互动大概率。

  15. DS 到底是不是只用了很少的芯片算力,这方面信息会越来越显露出一些。DS 的确在较大程度上节约了算力,相当于上一个阶段同体量模型算力消耗的七八分之一,这也符合这个领域模型量效比的演进规律。训练和推理的单位算力成本实际上在 DS 现象之前就已经在非常显著的持续下降了,推理成本普遍目前已经降至早期的千分之一不到,训练方面成本效率从 A100 到 B300 结合模型技术也有百倍提升。DS 的算力节约是这个演进过程的一部分。

  不过也不能完全排除夸大、减除、隐藏了一些状况,DS 的技术报告和各渠道披露出来的信息,也有的部分。而原因或许是:可能性之一,基于母模型部分成果,训练公开面市的模型产品,隐藏了母模型数据与训练等方面信息。可能性之二,模型数据准备和训练存在几个不同阶段,技术报告只涉及中后段情况。可能性之三,减除训练算力和芯片数量,有以此为亮点的传播考虑,也有不得已而为之的难言之隐。有一定概率 FP8 之前存在 FP16 的过程,以及一个隐藏在 V3 和 R1 后面的不完全体。

  16. 几个常识下的 LLM 老周期与物理模型等新周期:RL 增强学习其实更消耗算力;模型从预训练后训练蒸馏到不同量化程度下的不同体量模型交付,从数据、算法、训练、蒸馏、量化的精度来说,必然是做加法在前做减法在后, FP8 训练也不是不可以但大概率 FP16 过程在前;蒸馏是信息衰减知识衰减能力衰减而不是增益,只不过得失、体量、算力、效率之间会综合权衡;头部大模型整体到了“高可用”阶段,DS 的高可用不是独有现象。如果横向使用各类模型较多,会发现在 DS 上体验到的那些惊艳,在模型上也会通过问答体验到,一百一千一万个问题问下来,不同模型都会对一些错一些且统计差距不大,表现优异的部分和比较平庸的部分,分布在不同问题上。DS 不比头部模型整体更差,不过也没比头部模型整体更好。DS V3 和R1 实质上都处于 LLM 也就是大语言模型这个周期,多模态不具备,而产业整体已经开始进入时空智能、面向现实世界的物理世界模型的新周期开元体育。另外,DS 今天达到的高度,国产大模型之前在不同阶段也曾经从 SOTA等角度达到过,只不过是当时的高度,到今天为止各个国产大模型也是差距甚微,不分伯仲,不同问题上互有所长。发布以来,V3 的官方版、R1 渠道版都已反复使用,700 亿参数的 R1-Distill-Llama-70B 在本机安装使用,手机里的1.5B 的 8bit蒸馏版也下载体验了,综合质素不错,实感符合以上信息。

  17. 近期国内在 AI 几个方面的进展,其实才是真正处于前沿且有创新有探索。比如一些视觉理解模型、实时语音智能、基于物理法则的视频生成模型、世界模拟器(尽管距离真正的世界模型其实还差十万八千里)、比如生成与理解双向的多模态模型、AIAgent 的一些新探索、具身智能与机器人 3.0、传感融合与端到端下的 Transformer 自动驾驶 2.0。避免广告植入嫌疑不提具体企业和模型名称。无论千问、豆包、元宝、文心开元体育、Kimi、智谱、MiniMax 等,其实哪一家的探索、进展、贡献、成就,都不比 DS 低。AI 中国的崛起是全方位的,不是 DS 一个单点。

  18. DS 对芯片算力以及英伟达是不是构成冲击,这事的重要性已经排在末位,但总体事态是因这事而起,所以还不能无视。实际上:预训练算力资源有节约,但算力节约方面是有下限的,后训练 R1 实际上比 PRM+search 更消耗资源,推理方面DS 的R 系列也好OpenAI 的o 系列也好,未来整体会越来越耗费资源。

  前天英伟达大涨时我的反向看法:有一天英伟达 PE 掉到 30-40 倍不奇怪,而从目前的五六十倍掉到三四十倍,原因会是至少三个因素的耦合,一是算力需求增长拉动营收业绩成长从而拉低 PE,二是虚高的价值预期都会波动回调,这一点会反映在股价上,三是算力尤其推理算力供给走向多元化。但这三个原因里没有一个是:有一天 AI 不需要那么多算力了。以外,同样需要回调的是 OpenAI 飘了的心态和 Pro 账户高达 200 美元的每月金额。

  上前天英伟达大跌时我的反向看法:LLM 单位训推算力消耗本来就在下降,但LLM 周期后面是时空智能、具身智能、物理现实世界模型等新周期,这还不包括三个亿万卡时代。算力存在向上和向下两个曲线,一个曲线拼效率拼成本拼价格,对 AI 普及贡献大但对 AI 走向 AGI 的贡献微乎其微甚至可以忽略,另一个曲线拼算力拼模型原理拼脑能力进化从大语言模型走向物理现实世界模型,过程中力摘一个又一个 AI 圣杯。算力总体需求依然大幅增长。大跌是多因素耦合,是芯片算力股本身的回调、吐纳、换手需求,不能把所有下跌的账都记到 DeepSeek 的功劳簿上。不过英伟达惊吓得不轻,惊吓对挤泡沫有帮助。

  涨跌是市场对 PE 的重新计算,算力涨跌是各方对 AI 的重新评估。DS 开启了产业市场对芯片算力价值基本面的重新评估,好事。但头部企业因为大多已经同时处于上一个周期的成熟期和下一个周期的前端,所以推理服务需求剧增导致算力投资大增,数据和算力消耗高出几个数量级的新原理模型训练也需要巨额算力基础设施投资,训练更好的新的大模型还是需要更高的算力。所以今年头部企业基础设施投资大都在百亿美金以上甚至五六百亿美金这个水平。

  19. 有文章说因为 CUDA 不够高效,DS 训练已经绕过 CUDA 了,有点意思。抛开 PTX 不说,在另外一个层面,实际上理论上每家开发的大模型,都可以定制专门的 ASIC架构芯片来训练,且一定比英伟达的通用算力更高效,但 ASIC架构芯片开发成本高迭代周期长,推理可以等但训练往往等不了。只有资金和技术能力更强的大平台才有空间玩这个循环,比如 Google 自研自用的 TPU,也提供给 Apple 用来训练模型了。

  20. 中外互联网都有记忆,DS 技术报告提到的方法哪些是原创,哪些是采纳整合,哪些是别人也用过,哪些是第一次用,只要深度搜索都能了解到,不一一而足。这方面 DS 所开启的可能性到底是什么,以及创新到底是什么,时间是最好的答案。

  22. 不完全是自然传播,不同推手各自不同考虑,其评估、把握、预设值得商榷。只能说各种情绪都利用到了,引爆感也够强,但可控感差一些,也没有站在更高层面把握走向。

  如果非要用一句话概括当前所处阶段,可能是:星辰大海第一步。DS 的探索和贡献都值得肯定,但隐藏的问题以及带来的问题,和取得的进展一样多。太希望一个面成功的时候,容易对某一个点寄予过多希望,因为这个点是符号是载体也是心理象征。一些流量操作过度解读也有自身考虑。但这些容易误导各方。实际上应该对人工智能领域的重要方面给予全面关注,对升维竞争的创新前沿予以重点关注。生态创新才能实现可持续创新。这是一个端边云网感算数智多要素互相催化的复杂生态,一蹴而就、一夜变天、单点突破的思维,不符合发展规律,也没好处。

  纵观整个事态,山雨欲来的新版中国威胁论及时利用了适时出现的它,有做空和回调需求的金融市场也巧妙地利用了它。渴望崛起的我们有没有被利用先且不论,这件事的背后存在一个隐约可见的产业、科技、社会场等角度相互发酵的动力机制,一切并非偶然。

  中国 AI 必然全方位崛起,老美等必然全力遏制。还是那句话,中国必须走自己的路,不必看老美行事,AI 发展的指挥棒和话语权属于全球人类,不属于老美。但过程中要预判他们的预判,这样有助于走好自己的路。此外唯一需要斟酌的是,高调与低调之间,何种策略的收益为正,何种路径对整个产业而不仅是其中一家企业相对更为有利?此外,实事求是、务实精进更有利于发展,还是言过其实、势大于实更有利于发展?所有高出实际价值的信用透支最终都会转化为成本,只不过成本由谁来支付。水到渠成、实至名归的实力出击,一定好过于过早短兵相接,更好过于过早沽名钓誉(这里并非指 DS,而是过往存在的个别浮夸现象)。华为式的务实精进,是可以参考的现实模版。

  但是从业态、竞争角度,DS 给产业市场带来了活力,有希望发挥鲶鱼效应,尤其在影响大厂方面。更多的竞争,是用户的福音。尽管算力节约有下限,未来主要还是靠算力往上走模型原理往前走,但 DS 在 App Store 全球免费下载榜跃升为第一,还是一件非常提气的事。从这段时间小米、华为、OV 等应用市场的下载量分析,目前 DS 还是比头部 AI 的 App 少一两个零。破圈效应在转化为市场实地方面,实效不够,还需加力。尤其慕名而来的网民批量涌入的情况下服务一再出现卡顿问题,对流量转化为用户影响较大。推理服务方面的算力部署,需要及时扩大投资了。

  苇草智酷(全称:北京苇草智酷科技文化有限公司)是一家思想者社群组织。通过各种形式的沙龙、对话、培训、丛书编撰、论坛合作、专题咨询、音视频内容生产、国内外学术交流活动,以及每年一度的苇草思想者大会(原名互联网思想者大会),苇草智酷致力于广泛联系和连接科技前沿、应用实践、艺术人文等领域的学术团体和个人,促成更多有意愿、有能力、有造诣的同道成为智酷社区的成员,共同交流思想,启迪智慧,重塑认知。


相关标签:
热门产品