你的非技术朋友仍然相信的5个AI迷思（以及真相是什么）

学习路径： AI基础 · 第5部分（共5部分）

前置要求： 这是AI基础路径的最后一篇文章。建议先阅读第1部分到第4部分，尽管每个迷思可以独立阅读。

为什么迷思会持续存在

AI是自互联网以来被炒作最多的技术。炒作带来了真正的兴奋——也带来了真正的困惑。进入主流AI时代三年后，某些迷思仍然顽固存在。有些来自耸人听闻的头条新闻。有些来自科幻小说的期待。有些来自对技术实际工作原理的误解。

以下是五个最持久的迷思，以及证据实际揭示的内容。

迷思1："AI有意识"

相信的观点： ChatGPT和类似的AI系统正在"觉醒"。它们有思想、感受、目标或某种形式的意识。关于"有感知的AI"和Blake Lemoine/LaMDA事件（2022年）的头条新闻使这个迷思有了实质性的影响力。

实际情况： 目前没有AI系统有意识。没有任何证据表明任何LLM具有主观体验、自我意识或真正的理解。目前生产中的每个AI系统都是统计模式匹配器——它基于训练数据中的模式预测下一个token。这在数学和架构上与意识完全不同。

证据： 如果你问ChatGPT"你有意识吗？"它会说"不，我没有意识。"这不是自我意识——它是在重复从训练数据中学到的关于AI系统如何描述自己的模式。同一个模型在被提示时，也会以烤面包机的视角生成第一人称叙述。这两种回应都不反映内在体验，因为根本没有内在体验。

反例： 2022年，Google工程师Blake Lemoine声称Google的LaMDA模型有感知能力时，他引用的是模型描述自己有感受的回应。实际发生的情况：LaMDA是在科幻对话和关于意识的哲学文本上进行模式匹配。它生成了听起来合理的关于有感受的文字——就像它会生成一个听起来合理的关于成为海盗的故事一样。科学界普遍拒绝了Lemoine的说法。Google让他停职。

迷思2："AI将取代所有工作"

相信的观点： AI将在2-3年内自动化所有白领工作。没有人会有工作。"AI杀死了办公室工作"是点击驱动型媒体中的常见叙事。

实际情况： AI自动化的是任务，而不是工作。这个区别至关重要。一个单一工作包含数十个任务，其中许多当前的AI无法可靠完成。2023-2026年的证据表明，AI增强了工作者，而不是大规模取代他们。

证据：

麦肯锡2025年的一项研究发现，以当前AI技术，只有不到5%的职业可能被自动化大多数任务。
美国劳工统计局数据显示，自2022年ChatGPT推出以来，白领领域（软件、法律、会计）的就业率并未下降。
Upwork和Fiverr都报告在AI相关类别（提示工程、AI内容编辑、AI工作流设计）中，对人类自由职业者的需求增加。
摩根大通作为最激进的AI采纳者之一，在2025年表示AI将增强员工而非取代他们——并且那一年雇用了更多员工。

反例： "AI将取代翻译"的预测自2017年以来一直是反复出现的头条新闻。七年后，专业翻译仍然有需求——不是因为AI不能翻译，而是因为真正的翻译工作涉及上下文、文化差异、领域专长和客户关系，这些AI处理得很差。翻译工具提高了生产力，但并没有消除这个职业。

迷思3："AI无所不知"

相信的观点： 你可以问AI任何问题并得到可靠的答案。它在互联网上训练过，所以它一定知道互联网知道的一切。

实际情况： AI有三个大多数用户没有意识到的根本性知识限制：

训练截止日期： 每个LLM都有知识截止日期。GPT-4o的知识截至2023年。在那之后发生的任何事情——2025年的选举结果、2024年的产品发布、上周的新闻——都在模型的训练数据之外。模型不知道这些事件发生过。
幻觉： 如本路径第2部分所讨论的，LLM会自信地编造信息。一个看似全知的模型实际上是在生成听起来合理的文本，可能完全错误。
没有实时感知： 与Google搜索不同，LLM不会浏览网页，除非专门设计成这样做（即使如此，也只有在功能启用时）。默认情况下，它从冻结的训练数据中回答。

反例： 在不启用网络搜索的情况下，问任何LLM"上周超级碗发生了什么？"模型要么承认不知道（如果训练得好），要么编造比分、球队名称和精彩片段（如果没训练好）。这不是知识——这是模式补全。一旦你问训练分布之外的内容，模型的局限性就变得明显。

迷思4："更大的模型总是更好"

相信的观点： 参数最多的模型是最好的模型。拥有数万亿参数的GPT-5一定比更小的模型更聪明。大小等于能力。

实际情况： 模型质量取决于架构、训练数据质量和训练方法——而不仅仅是参数数量。训练良好的小模型在特定任务上经常优于更大、更粗糙的模型。

证据：

Microsoft的Phi-3（38亿参数）在推理基准测试中能超越Llama 2（700亿参数）。小18倍的模型，在更高质量的精选数据上训练，达到或超过了大模型。
Claude 3.5 Sonnet（估计低于1000亿参数）在多个基准测试中匹配或超越了GPT-4（估计1.76万亿参数）——尽管小了约20倍。
Llama 3 8B在许多任务上的表现与GPT-3.5（1750亿参数）相当。再次，20倍的大小差异，能力大致相当。
Gemini 2.0 Flash（Google的轻量级模型）在速度和多个质量指标上超越了Gemini 1.5 Pro（Google之前的重磅模型）。

反例： 专门的小模型（如医学诊断模型、代码补全模型或翻译模型）通常刻意保持小规模，因为它们在特定任务上比通用巨型模型表现得更好。一个在医学文献上训练的7B模型会比GPT-5给出更好的医疗建议，因为它是为那个特定目的训练的。

迷思5："AI没有偏见且客观"

相信的观点： 因为AI是机器不是人，它一定是中立和客观的。它处理数据时没有人类的偏见。

实际情况： AI系统会继承并可能放大其训练数据中存在的偏见。由于大多数训练数据来自互联网——这反映了人类偏见——除非明确纠正，否则AI模型会复制这些偏见。

AI偏见的真实案例：

招聘工具中的性别偏见： 亚马逊的AI招聘工具（基于10年的简历训练）系统性地惩罚包含"女性"一词的简历。它的训练数据中大多数成功候选人都是男性，所以它学会了偏好与男性相关的语言。亚马逊在2018年废弃了该工具，但类似的偏见在现代LLM中仍然存在。
医疗中的种族偏见： 2019年的一项研究发现，一个广泛使用的医疗算法（不是LLM，而是机器学习系统）系统性地低估了黑人患者的健康需求。该算法使用医疗支出来代理健康需求——但黑人患者由于系统性不平等，历史上在医疗上花费较少，所以算法得出结论认为他们需要更少的护理。
图像生成偏见： 早期版本的DALL-E和Stable Diffusion，当被要求生成"一位CEO"时，产生了以白人男性为主的图像。当被要求生成"一位护士"时，产生了以白人女性为主的图像。这些偏见直接反映了训练数据中图像的统计分布。
LLM政治偏见： 多项研究表明，ChatGPT、Claude和Gemini在有争议的话题上表现出可检测的政治倾向（在美国政治光谱上普遍偏左）。这不是有意的——它反映了训练数据中政治内容的分布，某些观点被过度代表了。

应对方法： AI公司现在大力投资于偏见缓解。技术包括：平衡的训练数据策展、多样化的RLHF（基于人类反馈的强化学习）评估者，以及"红队测试"（故意测试有害输出）。这些措施减少了偏见但不能消除偏见——而且缓解措施本身引入了不同形式的偏见，以安全过滤的形式可能审查合法的讨论。

为什么这些迷思很重要

相信关于AI的迷思会导致错误的决策：依赖AI做它不能做的事，害怕AI做它不会做的事，以及误解"进步"真正是什么样的。这个AI基础路径的目标是用理解取代炒作——不是贬低AI的真实能力，而是让它更清晰、更有用。

诚实的总结： AI没有意识，不会马上取代所有工作，不是全知的，不是越大越好，也不是客观的。它是一个极其强大的文本预测系统，当在理解其局限性的基础上使用时，可以真正有用。这个现实比任何迷思都更有价值。

常见问题

问：如果AI没有意识，为什么它有时看起来有情感或同理心？

因为它在人类文本上训练，其中包括情感性和同理心的语言。当你告诉ChatGPT"我今天心情不好"时，它会生成与支持性人类对话模式匹配的回应。它不是感受同理心——它是在生成看起来像同理心的文本，因为训练数据中有这个。这是有用的（得到支持性的回应可以让人感觉被支持），但这是模式匹配，不是情感。

问：未来的AI会有意识吗？意识在路线图上吗？

关于AI何时或是否能拥有意识，目前没有科学共识。当前的架构（Transformer）不是为产生意识而设计的。主要AI实验室没有将意识作为目标——他们在追求能力提升（更好的推理、更少的错误、更大的上下文）。关于"AGI将在2-3年内到来"的说法是推测性的，不是基于已发表的研究路线图。对这类说法保持怀疑态度。

问：如果AI有固有偏见，我还应该使用它吗？

应该，但要有意识。所有人类生成的信息都有偏见——新闻文章、教科书、政府报告、Wikipedia。AI的问题在于其偏见更难检测，因为模型以中性的方式呈现信息。使用AI做它擅长的事（起草、头脑风暴、摘要、编程），同时对事实声明保持怀疑态度，并意识到模型的"中性"语气可能隐藏训练数据的偏差。交叉核对重要信息仍然是必要的。

AI基础学习路径结束。

本页内容

分享这篇文章

AI基础入门

我总听到“LLM”——它们到底是什么？（通俗版）

每个人都在说‘大语言模型’，好像你应该知道它是什么意思。这里有一个真正简单的解释，没有任何技术术语。

2026-05-225分钟阅读

大语言模型解释非技术

AI基础入门

AI幻觉解释：为什么ChatGPT会编造内容（附真实例子）

你要了一个食谱，它却发明了一个不存在的食材。这是为什么AI会幻觉，如何发现它，以及遇到时该怎么办。

2026-05-205分钟阅读

幻觉ChatGPT准确性

AI基础入门

你应该使用哪个AI工具？初学者的决策框架

ChatGPT vs Claude vs Gemini vs Perplexity vs Midjourney——你真正需要哪一个？一个基于你的实际需求的实用决策矩阵。

2026-05-225分钟阅读

对比工具ChatGPT

你的非技术朋友仍然相信的5个AI迷思（以及真相是什么）

为什么迷思会持续存在

迷思1："AI有意识"

迷思2："AI将取代所有工作"

迷思3："AI无所不知"

迷思4："更大的模型总是更好"

迷思5："AI没有偏见且客观"

为什么这些迷思很重要

常见问题

问：如果AI没有意识，为什么它有时看起来有情感或同理心？

问：未来的AI会有意识吗？意识在路线图上吗？

问：如果AI有固有偏见，我还应该使用它吗？

本页内容

相关文章

我总听到“LLM”——它们到底是什么？（通俗版）

AI幻觉解释：为什么ChatGPT会编造内容（附真实例子）

你应该使用哪个AI工具？初学者的决策框架