苹果集成ChatGPT：大型语言模型如何运作？

睿鸿在线 • 2024年12月18日下午1:07 • 科技 • 0 views

苹果公司将ChatGPT集成到其平台后，数百万用户可以通过iPhone、iPad或Mac设备直接使用这项人工智能技术，无需再访问单独的应用程序或网站。这一整合引发了人们对ChatGPT工作原理以及大型语言模型（LLM）的广泛关注。

ChatGPT的工作原理

ChatGPT是由OpenAI开发的大型语言模型人工智能聊天机器人，与谷歌的Gemini、Anthropic的Claude或Meta AI等类似。这些聊天机器人能够理解文本并生成类似人类语言的文本。AI和机器人科学家Daniel Dugas指出，能够与电脑进行半连贯的对话仍然令人难以置信。

大型语言模型的工作原理并非像人们想象的那么复杂，其本质上是预测下一个单词，这与手机的文本建议功能类似。然而，其背后运作的机制却异常精妙。LLM通过对海量数据（包括书籍、社交媒体和互联网内容）进行训练，建立起类似人脑的单词关系映射。

大型语言模型的四个步骤

以句子“Don’t put all your eggs in one”为例，解释ChatGPT的工作流程：

第一步：标记化和编码

首先，句子会被分解成计算机可以理解的数字，即“标记ID”。例如，“Don’t put all your eggs in one”可以被分解成[91418, 3006, 722, 634, 27226, 306, 1001]。

第二步：嵌入

接下来，数字向量会根据上下文进行扩展。例如，“egg”一词有多种含义，将其数学化表示需要多维向量。在句子“Don’t put all your eggs in one”中，“egg”的向量可能为[27226]，而在“I ate an egg for breakfast”中，其向量可能为[16102]，这取决于上下文。