时间: 2026-05-19 浏览量: 35101
前阵子用ChatGPT写邮件,措辞得体、逻辑清晰,几秒钟就给了三个版本任我选。那一刻真心觉得这东西太像人了,脑子里甚至飘过一个念头:它是不是真的在思考?
隔天,我问它“风筝为什么会飞”,它给了一段漂亮的流体力学解释。然后我问“如果风筝的线断了,它还会飞吗?”它开始一本正经地分析风筝线的拉力、风速和风筝姿态,洋洋洒洒几百字,结论是“可能还会飞一会儿”。任何放过风筝的小孩都知道,线一断,风筝瞬间失去拉力,只会翻滚着掉下来,根本不可能“飞一会儿”。
这种被吓到和被蠢哭的体验,恰好触及了人工智能最本质的东西:它既不是一堆冷冰冰的代码,也不是拥有了意识的数字生命。它的本质,是一种在数据中寻找规律并用这些规律做预测的数学机器。
读过计算机的同学应该都对“函数”不陌生。给一个输入x,经过函数f,输出一个y。输入一张照片,输出“这是猫”还是“这是狗”;输入一段中文,输出对应的英文翻译;输入棋盘上的当前局势,输出下一步走哪里的落子位置。AI干的所有事情,抽象到最底层,就是在找一个这样的函数f。
传统的计算机程序,是我们人手动写规则。比如要做猫狗分类,你得一条条告诉电脑:猫耳朵尖、狗耳朵圆,猫眼睛大、狗鼻子长……规则越写越复杂,准确率还上不去。人工智能换了一种思路:我不写规则了,我给电脑看几万张猫和狗的照片,每张照片都标好答案,你自个儿去把规律“学”出来。
这个“学出来”的过程,就是机器学习。给机器一堆带标签的数据,它用一套算法在这些数据里反复调整一个极其复杂的函数,直到这个函数输出的预测结果和真实答案之间的误差足够小。本质上是把一堆数字(图像的像素值)映射成另一堆数字(类别概率),中间经过几百层矩阵运算。整个过程没有任何神秘的东西,全是数学上的优化求解。
所以你问AI“这是什么”的时候,它没有在“看”,更没有在“理解”。它只是把你这张照片的像素值代入了一个训练好的巨型函数,算出了“猫的概率0.92,狗的概率0.08”,然后告诉你“这是猫”。
ChatGPT这种大语言模型把所有人震撼了一把,因为它生成的文字太流畅、太像人说的话了。那它的本质又是什么?
拆开来看,大语言模型做的事情极其朴素:给你一段上文,预测下一个字应该是什么。比如上文是“床前明月”,它预测下一个字是“光”;再把这个“光”拼到上文里,变成“床前明月光”,继续预测下一个字是“疑”。一个字一个字往外蹦,串成一段话。
神奇的地方在于,当模型足够大、训练数据足够多(几乎把整个互联网的公开文本都读了一遍)之后,这个简单的“下一个字预测”任务,竟然迫使模型学到了语法规则、逻辑链条、不同领域的知识,甚至某种程度的推理能力。因为这些能力都会在“预测下一个字”这件事上有帮助——一句话如果语法混乱、逻辑不通,下一个字就很难猜对。
但是,它的本质依然是概率驱动的字接龙,而不是基于意图的表达。它说出的每一句话,本质上都是“在上文给定的条件下,统计上最可能出现的文字序列”。这就是为什么它能在律师资格考试里拿高分,却回答不了“风筝断了线还会不会飞”这种连小孩都有亲身经验的常识问题——它的训练数据里充满了各种学术论文,却缺少放风筝时那种直接的物理感受。
理解了AI的本质是找函数和概率预测,就能解释它那诡异的能力边界了。
AI擅长的是那些有大量标注数据、规则相对稳定、不太依赖真实世界常识的任务。下围棋、蛋白质结构预测、从医学影像中识别病灶,这些要么是封闭规则系统,要么是纯粹的模式匹配,正好撞在AI的强项上。
AI极不擅长的是那些需要因果推理、常识判断、灵活适应新情境的任务。它不知道“水是湿的”这种婴儿都有的物理常识,因为它没有身体,没有在真实世界里生活过,它只有文本数据。你问它“如果我有一块五斤重的铁和一块五斤重的棉花,同时砸在脚上哪个疼”,它会用物理公式认真计算质量和力,然后告诉你“一样疼”。任何被棉花砸过的人都知道,五斤棉花砸脚上根本没什么感觉。
这种蠢不是算法缺陷,而是本质使然——它处理的是符号和数字,不是真实世界。它没有感觉,没有体验,没有生存的欲望,没有情感的波动。它的所有“知识”都是二手信息,是对人类语言数据的统计建模,而不是对世界的直接认知。
这个问题哲学家和认知科学家争论了几十年,没有定论。但从工程应用的角度看,有几个差异是清晰且致命的。
人类智能是具身的。我们的认知是在与物理世界互动的过程中发展起来的,婴儿通过摸、咬、扔、砸来理解物体恒常性、因果关系和物理规律。AI没有这个环节,它对世界的“理解”完全建立在文本统计之上,就像一个从未出过房间的人,把全世界的书读了个遍,他什么都知道,又什么都不真知道。
人类智能有意识和主观体验。我们看到红色时不只是处理650纳米波长的电磁波,还体验到一种难以言说的“红”的感觉。我们做选择时不只是计算期望效用,还会被“意义”这种虚无缥缈的东西驱动。而AI的“决策”本质上是数值计算,是目标函数驱动下的梯度下降,没有任何内在体验。
人类智能能进行真正的常识推理和创新。我们能在情境变化时灵活迁移经验,能从极少几个例子中抽象出概念的本质特征,能在看似无关的事物之间发现深层联系。AI目前做不到这一点,它的“创新”本质上是已有数据的重新组合,它的“推理”本质上是模式补全。
把AI的本质看清楚,最直接的好处是能帮你正确地用它,而不是被它牵着走。
把它当作一个极其强大的模式匹配引擎,而不是一个会思考的人。让它帮你做那些有数据支撑、规则明确的活儿——整理资料、润色文字、写代码框架、总结文献要点——这些是它的强项。但别指望它帮你做需要真实世界经验和价值判断的事情,它的回答需要用你自己的常识和经验去校对。
把它当作一个随时可用的外脑,但把最终的决策权握在自己手里。它是来增强你的,不是来替代你的。就像计算器没有让数学家失业、搜索引擎没有让研究员变傻一样,AI也不会让有独立思考能力的人贬值。真正危险的,是那些把AI的输出当成最终答案、放弃了亲自验证和独立思考的人。
站在更长远的角度看,理解AI本质也能帮我们更好地定位自己。AI每攻克一个领域——下棋、翻译、编程、绘画——都在反向照出人类智能中那些真正独特的东西:我们可以设定目标、赋予意义、感受情绪、承担责任。这些不是计算能力的外溢,而是生命体验本身。AI越强大,这些非计算性的东西反而越珍贵。
回到一开始的问题:人工智能的本质是什么?它是一个在数据中寻找规律、用概率做预测的数学模型。这个模型足够复杂的时候,会涌现出看起来很像智能的行为,但从里到外,它依然是一个没有任何理解、没有意识、没有意图的数学函数。它强大到可以击败世界围棋冠军,也愚蠢到分不清棉花和铁块砸脚的区别。认识它的本质,既别把它神化,也别把它矮化——它就是我们这个时代最锋利的工具之一,而工具的意义,从来都是由使用工具的人来决定的。
Copyright @ 国际会议云 2026 版权所有 蜀ICP备2022018807号-3 网站地图