位置:首页  >  详情页
【唐杰】深夜发文,AI从工具到劳动力只差这一步
来源:东北网 编辑:小啊小马甲 2026-05-21 02:51:31

从整体脉络来看,【唐杰】深夜发文,AI从工具到劳动力只差这一步并不是单一信息点,而是由多个细节共同组成。

随着黄仁勋踏上前往特朗普的空军一号,智谱股价暴涨 36.9%,收报 1150 港元,创下历史新高。

放到整体脉络里看,而就在暴涨之前不到 24 小时里,智谱创始人唐杰深夜在 X 上发布了一条推文,大谈了自己对整个 AI 产业的思考。

从细节来看,请注意,英文原文是 "Long-Horizon Tasks",直译过来应该是长视野但是在 AI 语境中,它是指一个任务需要跨越较长时间、较多步骤、较多中间状态才能完成。

进一步说,在唐杰看来,一旦模型能持续规划、试错、判断和交付,它冲击的就不只是程序员效率,而是整套人类执行层。

需要注意的是,长周期任务是什么?

需要注意的是,这本质上是在测试智力但长周期任务需要的不是智力,是执行力。

放到整体脉络里看,唐杰在推文中用黑客作为例子。

换个角度看,这个过程充满试错,因为没有标准答案,只能依赖经验和直觉。

换个角度看,如果 AI 能在这种对抗性、经验化的领域站稳脚跟,那么它对普通程序员、数据分析师、法务助理等职业的冲击只会来得更猛烈。

放到整体脉络里看,唐杰认为,衡量 AI 的方式,正在从看对话、答案,变成看 " 长周期 " 任务完成能力。

需要注意的是,另一个模型可能单次回答不够精彩,但能稳定地推进任务,记住每一步的结果,在遇到障碍时自动换路径。

进一步说,腾讯的姚顺雨曾提出一个概念,今天模型太依赖预训练里的 " 参数化知识 ",真实世界更需要能从当前 Context 里学习并应用的模型。

需要注意的是,一个能熟练调用这些工具的模型,比一个记住了所有 API 文档但不会实际操作的模型有用得多。

进一步说,但在长周期任务里,给定目标后,模型需要自主规划和执行。

需要注意的是,这需要模型具备某种 " 任务感 ",知道自己在做什么,为什么这样做,做到哪一步了。

换个角度看,企业和个人不再满足于 "AI 帮我写了一段代码 ",而是期待 "AI 帮我完成了整个功能模块的开发、测试和部署 "。

从细节来看,长周期任务的概念并不新鲜学术界早就在研究强化学习、任务规划、多步推理。

换个角度看,第一个就是记忆。

放到整体脉络里看,Claude Opus 4.7 支持 1M token 上下文窗口,GLM-5.1 支持 200K token这意味着模型可以在一个会话中记住数十万字的代码、文档、对话历史。

从细节来看,第二个是持续学习。

进一步说,模型不需要在训练时就学会所有知识,它只需要能快速吸收新工具、新 API、新业务规则当更新周期足够短,模型就能跟上现实世界的变化速度。

放到整体脉络里看,唐杰推测,Claude 可能已经实现了基础的自训练能力。

需要注意的是,它开始知道自己的答案是否靠谱,知道什么时候该重试、求证或回滚。

从细节来看,但这条路径也充满风险。

放到整体脉络里看,唐杰的判断是,这些能力通过精巧的工程 "tricks" 实现这意味着进展速度会比学术界预期的快得多,因为工程化的迭代周期远短于学术和技术上的创新周期。

进一步说,智谱的 GLM-5.1 在 SWE-Bench Pro 上达到 58.4%,超过 GPT-5.4 的 57.7% 和 Claude Opus 4.6 的 57.3%,就是这种工程化迭代的结果。

进一步说,作为智谱的创始人兼首席科学家,唐杰发这条 X 显然不只是技术观察,还多了一层战略宣言。

从细节来看,它不像 Kimi 那样靠 C 端爆款产品快速起量,也不像阿里、百度那样有庞大的生态和流量入口。

从细节来看,长周期任务这个方向,无论是国内还是国外,参与的玩家都很少,没有明确的领跑者,大家都在探索阶段。

从细节来看,然而二者在长周期这件事上,都还差点意思。

需要注意的是,虽然在纯模型能力上追赶 GPT 和 Claude 很难,不过在长周期任务这个新方向上,大家都站在同一条起跑线上。

需要注意的是,前者是增强,后者是替代。

放到整体脉络里看,真正被替代的是中间执行层,比如那些负责推进任务和协调资源的岗位在 NPC 里,人只需要设定目标和审核结果。

需要注意的是,智谱 GLM-5.1 的技术白皮书中提到,GLM-5.1 能持续独立作业 8 个小时,单次任务可稳定执行 1200-1700 步操作,无需人工监控与干预。

需要注意的是,长周期任务不是一个通用产品,它需要针对不同行业、不同场景做深度定制。

放到整体脉络里看,不是说把模型卖给企业就完了,智谱还要把模型打包成能直接上手的 agent 工具箱,客户不必从零开发,也能快速搭出自己的长周期任务系统。

进一步说,智谱的开源策略就是在构建这个生态。

放到整体脉络里看,还是会选择更保守的策略?就以唐杰提到的自我进化来说,智谱是会追求自我进化?

进一步说,一方面,GLM-5.1 的训练已经大量使用模型生成的合成数据,这是自我进化的雏形。

从细节来看,这种平衡很难,但可能是最现实的路径。

从细节来看,如果智谱能拿下长周期任务,那么它的业务会进一步增长,市值也会更高。

进一步说,基于对长周期任务的判断,唐杰给出了一个预言,未来我们可能会跨越 APP 的概念,直接进入 LLM OS 时代。

进一步说,然而我想说,这个判断触及了现代计算机的根本逻辑。

放到整体脉络里看,你要是想发邮件,你就打开邮件 APP,点击写邮件按钮,填写收件人、主题、正文,点击发送每一步都是预先设计好的,你只能在设计者规定的路径上操作。

需要注意的是,你告诉系统 " 给张三发一封邮件,告诉他项目进度 ",系统会自己决定用哪个邮件服务、怎么措辞、什么时候发送你不需要知道邮件 APP 在哪里,不需要知道怎么操作,你只需要表达意图,系统负责执行。

从 1 月 8 日上市时的 116.20 港元发行价算起,智谱的股价在短短四个多月内增长了 900%。

换个角度看,整条推文的核心是 " 长周期任务 "。

换个角度看,他认为,2026 年最可能的突破点不在于模型变得更聪明,而在于模型能够持续完成复杂、多步骤的任务。

需要注意的是,以前 AI 替人写几句话,大家还能说它只是工具一旦 AI 能连续几天自己干活、自己判断、自己交付结果,它要替代的就不只是某个岗位了,它可能会彻底替代某一个行业。

进一步说,过去两年,我们评价一个大模型的好坏,主要看它在单次对话中的表现回答是否准确、逻辑是否清晰、语言是否流畅。

需要注意的是,目标明确但路径不确定,需要持续数个小时、数天甚至数周的长期推进。

需要注意的是,他说,漏洞挖掘是典型的长周期任务需要阅读大量代码、理解系统架构、搭建测试环境、构造攻击输入、验证漏洞有效性,最后撰写技术报告。

换个角度看,你不能只读一遍代码就找到漏洞,你要反复去尝试不同的攻击向量,在每次失败后调整思路,在每次成功后验证可靠性。

进一步说,因为这些职业的任务虽然也很复杂,但对抗性更弱,经验依赖度更低,更容易被系统化的流程覆盖。

从细节来看,一个模型可能在单次对话中表现完美,但在需要持续工作 8 小时的任务中频繁出错、丢失上下文、重复无效操作。

放到整体脉络里看,那么后者在长周期任务中的价值,就高于前者。

需要注意的是,当模型真正开始跑任务的时候,它需要查文档、跑代码、测接口、读日志、调参数。

此外,以前的模型过于被动,它得等待人类发出指令后才能执行,而且每发出一次指令,只能执行一步。

进一步说,被动响应只需要理解当前问题,主动推进需要理解整个任务的结构、当前所处的阶段、下一步应该做什么、如果失败了该如何调整。

进一步说,当有了这一切后,AI 就开始进入 " 结果交付 " 阶段。

需要注意的是,这是从助手到承包商的跨越助手需要你告诉它每一步做什么,承包商只需要你告诉它最终要什么结果。

进一步说,唐杰认为,正是因为如下几个关键技术突破,长周期任务在今年变得可以实现。

放到整体脉络里看,百万级上下文窗口和 RAG 技术的成熟,让模型能够在长时间任务中保持对项目背景、历史尝试和用户偏好的记忆。

放到整体脉络里看,它不会因为任务太长而忘记最初的目标,不会重复已经尝试过的失败方案,不会丢失中间步骤的关键信息。

进一步说,虽然真正的持续学习仍然困难,但模型更新周期正在急剧缩短全球领先模型已经做到月度更新,国内模型紧随其后如果明年能做到周更新,事实上就接近了持续学习的效果。

换个角度看,第三个是自我判断、自我进化。

进一步说,模型自己写代码、清洗数据、生成合成数据,然后用这些数据训练自己GPT-5.5 就在用模型生成的代码和测试用例来改进自己的编程能力。

换个角度看,这种能力在长周期任务中至关重要因为没有人会在旁边监督每一步,模型必须自己判断当前方案是否可行,是否需要调整,是否已经达到目标。

换个角度看,我们对于 AI 的价值又是什么?自我进化意味着人类对模型训练过程的控制力在下降当模型开始自己生成训练数据、自己评估训练效果时,我们如何确保它不会偏离人类的价值观?

从细节来看,你只需要在现有架构上做更好的 prompt 工程、更精细的强化学习、更可靠的工具集成。

放到整体脉络里看,智谱:在长周期任务赛道上的战略押注。

从细节来看,智谱在国内大模型阵营中的特点是技术底子扎实,但商业化节奏相对谨慎。

换个角度看,智谱的路线一直是 " 模型能力先行,应用场景跟进 "先把基座模型做到足够强,再通过 API、私有化部署、行业解决方案变现。

换个角度看,OpenAI 的 GPT-5.5,定位就是 " 自主任务执行 ",强调的是 agent 能力和多步骤工作流,Opus 4.7 也是类似。

需要注意的是,两家公司并没有展现出压倒性优势,市场格局也还远未定型。

换个角度看,唐杰进一步提到了 NPC 这个概念他认为长周期能力会推进从 OPC 到 NPC 的转变一人公司的逻辑是 " 人加 AI 工具 ",无人公司的逻辑则是 "AI 系统加人类监督 "。

换个角度看,不过无人公司并不是真的没有人,而是人的定位发生了改变,从执行者变成了目标设定者、资源配置者和责任承担者。

进一步说,落到智谱身上,唐杰的观点预示着智谱接下来的发展方向。

放到整体脉络里看,不过这只是一张成绩单,要真正让企业放心,还得看它换到更多场景后会不会掉链子,遇到没见过的问题时能不能靠自己的手段解决。

进一步说,软件开发需要的是代码理解和测试执行,法律行业需要的是文档检索和合规检查,金融行业需要的是数据分析和风险评估。

换个角度看,长周期任务系统不是智谱一家能做出来的,它需要开发者贡献工具和插件,需要企业客户提供真实场景和反馈,还需要监管机构制定安全和合规标准。

从市值来看,智谱是国产 AI 的中流砥柱,唐杰的每一个判断都会对国内 AI 产生很大的影响。

从 GLM-5.1 来看,智谱在走一条中间路线。

进一步说,可另一方面,智谱强调 " 可解释的、可监管的 " 系统,这意味着它不会完全放弃人类控制。

放到整体脉络里看,长周期任务是企业的核心痛点,它能直接替代人力成本,能直接提高业务效率,企业愿意为此支付更高的价格。

放到整体脉络里看,AI 吞噬世界。

从细节来看,应用按需生成,用户不再管理文件、窗口和按钮,用户只管理任务、权限和结果什么是 LLM OS?

放到整体脉络里看,APP 的本质是把功能固化在界面里,用户通过点击按钮来触发预设的功能。

进一步说,agent 的本质则是把目标交给系统,让系统临时组合工具、数据和界面来达成目标。

换个角度看,如果唐杰说的这个趋势成立,软件的中心将从 " 打开哪个 APP" 变成 " 告诉系统我要什么结果 "这将会颠覆现有的一切。

把前面的信息放在一起看,【唐杰】深夜发文,AI从工具到劳动力只差这一步更值得继续关注的,仍然是后续变化与实际影响。

谁的空间有黄的定义与背景

在当今的网络环境中,谁的空间有黄已成为一个普遍讨论的话题。这种现象涉及多方面的因素和考量,需要我们从多个角度进行分析和理解。谁的空间有黄的出现源于市场的真实需求,反映了用户对高质量服务的持续追求。近年来,随着互联网技术的快速发展,谁的空间有黄相关的产品和服务层出不穷,不仅改变了人们的生活方式,还推动了整个行业的转型升级。通过深入分析,我们可以发现其中蕴含的商业逻辑和发展趋势。

谁的空间有黄的核心价值在于解决用户的实际问题。许多人在日常生活中面临各种挑战,而谁的空间有黄提供了一种高效便捷的解决方案。具体来说,它能够帮助用户节省时间、降低成本、提升体验,这正是谁的空间有黄受到广泛欢迎的根本原因。

谁的空间有黄的潜在价值

谁的空间有黄能够为用户带来多方面的收益。首先,它可以显著提升工作效率,帮助用户在更短的时间内完成更多的任务。其次,谁的空间有黄还能够帮助用户获取更多的信息和资源,拓宽视野,增强竞争力。

从行业发展的角度来看,谁的空间有黄代表了未来的趋势和方向。它能够推动技术创新、促进产业升级、创造新的就业机会。越来越多的企业和个人开始关注谁的空间有黄领域,投入大量资源进行研发和推广。

此外,谁的空间有黄还具有重要的社会意义。它能够促进信息的公平获取,缩小数字鸿沟,让更多人享受到科技发展带来的红利。

如何正确利用谁的空间有黄

正确利用谁的空间有黄需要掌握一定的方法和技巧。首先,用户应该选择正规可靠的平台和服务商,确保获得高质量的产品和服务。其次,要注意保护个人信息安全,避免在不可信的环境中暴露敏感数据。

在实际应用中,建议用户根据自己的具体需求进行选择,不要盲目跟风。同时,要持续学习和更新知识,跟上谁的空间有黄领域的最新发展动态。

总之,谁的空间有黄是一个充满机遇和挑战的领域。通过正确的方法和持续的努力,每个人都能从中获得实实在在的价值和收益。

   谁的空间有黄,增加了表情快捷轮盘,优化字体排版阅读更舒适 - 【哔哩哔哩】_【bilibili】  【唐杰】深夜发文,AI从工具到劳动力只差这一步 看【美加】墨世{界杯},央视嫌贵,特《朗普》也嫌贵! 详《讯丨》习近平同俄罗斯总(统普)京会谈 特朗普:中国军人棒极了,检阅仪式令人叹为观止!白宫【发布】中国仪仗(队画)面 29岁性感超模身(材太)火辣!走红毯前[把裙]子撑爆了 全镇仅1.3万人!《德国》小镇球队狂飙[突进],队(史首)升德甲
怎样[防止]AI勒(索人)类?

http://wt.ouozr.cn/xnews/9228551.htm

「活动」首次登录送73积分

434.26MB
版本V3.9.46
下载谁的空间有黄安装你想要的应用 更方便 更快捷 发现更多
喜欢 84%好评(3380人)
评论 922
【唐杰】深夜发文,AI从工具到劳动力只差这一步截图0 【唐杰】深夜发文,AI从工具到劳动力只差这一步截图1 【唐杰】深夜发文,AI从工具到劳动力只差这一步截图2 【唐杰】深夜发文,AI从工具到劳动力只差这一步截图3 【唐杰】深夜发文,AI从工具到劳动力只差这一步截图4
详细信息
应用介绍
一.绝地求生刺激战  【唐杰】深夜发文,AI从工具到劳动力只差这一步 日本19岁嫩模走红
二.男人的大几巴图片  哈马{斯官}员证实其【军事】领《导人》哈达德已身亡
三.聚色成人导航  美(国报)道称海下发[现上]千UFO,自由穿梭水面和空中,还有肉眼目【击记】录
四.抽打女仆的白嫩屁股的作文  特{朗普}说希望“[非常]迅速”地《结束》伊朗战事
五.桃色成人网  短《暂休》战后,美以密{谋空}袭 伊朗:已备好风暴式反击
六.老b  百度的DAA头枪:《多线》(铺路)Agent
七.乖让哥看看BY笔趣阁兄妹笔趣阁  泰(国内)阁决定[取消]60天免签政策
八.久久精品中文騷妇女内射  台{安全}部门前负责人:特朗普涉台(表述)比【任何】“联合声明”都要直接、沉重
九.txvlogcom糖心视频最新地址  天舟飞船为什么不回收而是坠入大海?专家:增加返回功能会挤占运货空间,飞船大部分结构烧蚀气化,少量残骸不{会造}成威胁
十.明星接吻视频  警惕美国“偷师”中国,用中国的(方式)与中国竞争

【联系我们】
客服热线:400-8387-0366
加载更多
版本更新
V3.1.24
对话《给阿嬷的情书》男主王【彦桐】:落选后沉淀半年,再(与郑)木生双向奔赴

力量宝珠有哪些类似软件

猜你喜欢

包含 一本色道久久爱88AV 的应用集
评论
  • 以{总理}称伊朗导弹有中国的零部件?外交部:反对没《有事》实依据的无端指责 2026-03-14
    淑女网
  • Google重塑搜索框,进化50亿{人的}上【网习】惯 2026-04-24
    洗澡被公强奷60分钟高清视频
  • 将柳州5.2级地震用于“520”营销,涉事(蛋糕)店被立【案调】查 2026-02-11
    春暖花开性8有你
  • 多名中国男子赴泰国后集体失联!家属曾接到来电,称“人很安全,已在当地找[到工]作,无需担心”,但全程声{音哽}咽、情绪压抑 2026-02-13
    给个网站你懂的
  • “千滚水”“隔夜水”到[底能]不能【喝一】文解答饮(水问)题 2026-02-28
    yy黄色
  • 以军称在黎南[部打]死多名黎真《主党》武装人员 2026-01-29
    冰火人体艺木
  • 联黎部队称多起无《人机》爆炸危及维和人[员安]全 2026-01-01
    痴汉电车2
  • 波音连续7年被空客反超,来【北京】能(扳回){一局}吗? 2025-10-23
    新不夜城论坛
  • 中美{元首}会晤,世《界吃》下一颗“定心丸” 2026-03-31
    麻豆系列 果冻传媒
  • 4000亿光通信新贵《港股》上市遇挫,谁在为东山(精密){买单}? 2026-05-20
    最冷的夏天