正如 IBM 的一份报告所强调的那样,首席执行 语言数据的力量 官们感受到了加速采用的压力,即使他们不确定如何采用:三分之二的首席执行官正在使用生成式人工智能,但并不清楚它将如何影响他们的员工,而这正在影响进一步的投资和决策。
无论您是一头扎进去,观望还是介于两者之间,您的公司中可能已经有人在尝试 ChatGPT 或众多可用的商业法学硕士之一。但是,当谈到如何安全地前进,同时抓住这种技术可能提供的竞争潜力时——这是我们经常被问到的一个问题——采取“第一原则”的方法来平衡战略和执行是很好的。
起点:语言就是数据
企业需要如何思考这种新的人工智能能力?语言就是数据。推动这一新一轮变革的技术是人工智能,它能够模拟一些以前被认为是人类独有的能力。这并不是什么新鲜事。
新鲜且爆炸式增长的是使用语言交换和创建信息的能力——由 ChatGPT 实现。
为什么这是起点?因为语言在您的业务中无 whatsapp 号码数据 处不在。它存在于您创建的文档(演示文稿、报告、研究)中,存在于您的 CRM 中,存在于您与客户的直接沟通中,存在于电子邮件中。如果您是一家保险公司,语言就是填充您的索赔或风险评估流程的内容。如果您是一家制药公司,语言就是推动药物研发和临床试验流程的信息。
语言就是数据,任何公司都应该考虑它如何影响业务中的决策、成本、收入和风险。
话虽如此,让我们看一个关于如何使用这项技术的简单框架。
了解生成式人工智能和法学硕士 (LLM) 的能力
生成式人工智能和大型语言模型绝对是你应该关注的。但不要急于采用,而要急于充分了解该技术的能力和局限性。
让我们先从一些定义开始。生成式人工智能生成内容。GPT 是一种大型语言模型,这些模型基于一组数据进行训练。它们的工作原理类似于我们在某些电子邮件客户端和手机上看到的文本预测功能。它不是理解单词的含义,而是使用一种称为词嵌入的语言技术来预测下一个可能出现的单词。因此,它无法理解事实——它只是识别文本模式。
它们之所以如此令人信服,是因为它们训练时使用了海量数据。考虑到 ChatGPT 最初的训练模型包含了来自各种来源的 100 多万个数据集。这相当于大约 300 年的语言量。
考虑到这一点,以下是他们做得好的一些事情:
- 生成自然语言文本的能力:LLM 可以生成连贯流 根据职位描述定制您的BI分析师简历 畅的自然语言文本,这在内容创建方面有许多应用,例如聊天机器人和用于写作任务的文本生成
- 能够生成图像、视频和代码
- 在情感分析、摘要和机器翻译等特定NLP任务中具有较高的准确率
了解法学硕士的局限性和风险
要了解法学硕士在商业领域的风险和局限性,重要的是要认识到,由于法学硕士的构建和培训方式,其某些特征是固有的:
- 他们缺乏逻辑或理性思考
- 它们缺乏类似人类的推理能力
- 答案和回应无法解释
- 他们“知道”什么取决于他们接受训练的数据
- 它们是能源密集型和计算密集型的:即运行成本高昂
这些特性使得该技术可用于产生新想法,这对于生 购买电子邮件列表 成初稿甚至生成代码非常有用。然而,它会导致许多现在广为人知和讨论的风险。
自 ChatGPT 首次发布以来,OpenAI 等公司已在当前的 GPT 版本中添加了一些人工监督训练(带有人工反馈的强化学习)。然而,偏见、个人数据保护和版权方面仍然存在重大风险。在等待全球某些法律案件和法规的结果时,它们的使用最终可能会成为一个真正的合规问题。