许多企业发现,在互联网上训练的现成AI模型可能仍然缺乏对其领域的具体、深入的了解。
PGA巡回赛数字和广播技术高级副总裁Scott Gutterman意识到,生成式 AI 的基础模型可以在来自互联网和其他来源的大量数据上进行训练,但即使在高尔夫等主流话题上,它仍然缺乏深入、具体的知识。
例如,ChatGPT连关于高尔夫基本知识的问题(老虎伍兹赢得PGA巡回赛多少次)也会答错。“有数据缺失,也有的数据过于泛化。这些一部分导致了(机器人的)回答会很笼统,Gutterman说。在这个例子中,ChatGPT 偶尔会说老虎伍兹赢得了 15 场 PGA 巡回赛冠军,而事实上,他已经赢得了 82 场;赢得15场的是大满贯赛。本质的问题在于,模型不理解“大满贯赛冠军”与“PGA巡回赛冠军”之间的区别。
随着人工智能项目从试点项目阶段逐渐进入运营阶段,企业用户发现,如果要让当今的通用模型(如 Anthropic 或 OpenAI 提供的模型)发挥作用,就必须为其新增更多行业特定或业务特定的数据。
例如,法律科技公司 Luminance 拥有一个 AI 模型,该模型在过去 10 年中专门针对超过 1.5 亿份法律文档进行了训练。 Luminance 首席执行官 Eleanor Lightbody 表示,在法律背景下出错可能会带来灾难性的后果。“这就是为什幺拥有经过法律合同训练的 AI 如此重要。”
但研究公司国际数据公司的人工智能和数据总经理兼集团副总裁兼全球人工智能负责人 Ritu Jyoti 表示,要增强模型也得考虑成本和复杂性。只有当一家公司从头开始训练自己的模型时,才能达到目前最高的准确度。但这种方法所需的成本和人才对大多数企业来说是难以承受的。拜耳的 McQueen 表示,例如,定制一个小型语言模型的成本可能从 50 万美元到数百万美元不等。而模型持续的维护又需要额外费用。
另一个问题是,多少增强足以使模型足够准确和可靠,可用于特定用途。包括咨询公司、亚马逊网络服务等云提供商以及 OpenAI 等模型制造商在内的一系列公司都在努力提供帮助。