ThoughtSpot Sage: GPT-3驱动的AI分析
目录
- 引言
- 什么是语言模型
- 大型语言模型的特点
- 大型语言模型在商业智能中的应用
- 自然语言搜索与生成答案
- AI辅助的数据建模
- AI搜索推荐
- 会话式AI和Co-pilot体验
- 商业智能产品的未来发展
- 用户以自然语言提问
- 数据可视化与分析
- 数据建模的加速和简化
- 数据分析师的转型角色
- 大型语言模型的挑战与解决方案
- 幻觉问题
- 缺乏领域专业知识
- 个性化需求与定制化建模
- 用户体验的提升与交互设计
- 结论
引言
大家好,欢迎参加关于AI驱动的分析的本次讲座。在今天的会议中,我们将由ThoughtSpot的联合创始人兼CTO Amit Prakash和产品总监Santiago Pombo为大家介绍。我们非常激动地向大家介绍我们的全新功能Sage,这是一个结合了自然语言处理和生成式人工智能的GPT驱动的功能集。Sage通过我们专利的搜索技术,使任何人都能够通过简单的自然语言提问来揭示数据洞察,而无需具备技术知识。
在正式介绍产品之前,我将先将话题交给Amit,他将花几分钟为我们带来关于GPT和大型语言模型以及它们对商业智能的影响的见解。
「🤔」什么是语言模型?
语言模型,简单来说,就是使用AI系统预测下一个词。有时候,预测下一个词可能很简单,比如“天在下雨。”这是一个经常出现的短语。但是,如果你正在阅读一本阿加莎·克里斯蒂的小说,在结尾处写道“我知道凶手是...”,你就需要做很多推理才能猜出下一个词。你需要真正理解谁是这些角色,有哪些线索,他们之间的人际关系等。这就是为什么语言建模如此有趣的原因。你可能不知道,但你已经使用了语言模型二十多年了。例如,当你在Google中输入一些内容并获得查询的下一个可能的单词时,这就是一个简单的语言模型。我们过去几个月一直在努力研究的是大型语言模型。那么,大型语言模型究竟是什么呢?它们基本上是用于预测下一个词的AI模型,但它们是相当庞大的神经网络。这些网络调整了数千亿个参数,使它们能够执行他们的任务。有趣的是,这些大型语言模型所展现的“拥有计算能力”的特性并不是人们早期设计或计划的结果。这些特性突然出现,就像你观察一只蚂蚁一只、两只或四只蚂蚁在桌子上没有什么有趣的,但是当你有几千只蚂蚁的时候,突然之间就会出现一个非常有趣的蚂蚁群体,你可以看到一种分工和不同的工作模式以及它们所遵循的不同行动路线,以及各种各样的涌现性质。与此类似,当你将神经网络扩大到超过100亿个参数的规模时,它们开始显示出一种理性等特性,这使它们变得如此有趣,也是为什么每个人都对此如此激动的原因。关于大型语言模型的最后一点是,它们虽然已经存在一段时间,但它们的输出却不是很有趣,有时甚至相当冒犯。一些研究人员称之为开放AI所做的工作,他们对这些模型进行了微调,以使其更符合聊天机器人的良好体验,这使它们变得更加可用。这就是我们过去几个月一直在讨论的大型语言模型,当我们说起Chat GPT或GPD4时,就是指它们。
「🚀」大型语言模型的特点
谈到大型语言模型的引人之处,一个最有趣的特性是所谓的“零尖锐学习”。在过去,当你面临一个机器学习问题时,你会收集大量与该特定问题相关的训练数据。例如,当你想要进行情感分析时,你会收集很多句子,并让某人为其进行标注,例如这句句子是否有积极或消极情感。然后你会训练一个模型,最终得到一个情感分析器。而现在,这些大型语言模型做的事情是,即使它们没有接受过特定任务的训练,当你让它们进行预测时,它们对于许多问题都可以表现出色。例如,它们从未接受过算术训练,但如果你问“5加3等于多少”,它会直接回答“8”。零尖锐学习是这个想法的一种扩展,在这种想法中,这些模型可以在没有特定训练的情况下做一些事情,但如果你只是在上下文中给它们一些例子,它们通常能够弄清楚如何做到这一点。例如,在情感分析案例中,它们并没有接受情感分析的训练,但如果你给它们一些关于如何为句子标注情感的例子,它们可以非常好地在句子中进行情感检测。第三个是一种非常有趣的特性,叫做链式推理,在这一点上很多人都会说“哇,这些东西似乎真的是智能的”。当问题的复杂性稍微增加时,这些大型语言模型很难仅凭简单的指令就能做到,但是如果你一步一步解释你的推理过程,例如你问一个物理问题,例如两个以不同速度运动的小球发生碰撞,五秒钟之后,你会在哪里找到这个小球,这个模型自己是不会做到的,但是如果你一步一步地解释你的推理过程,例如你解释这个小球的速度,碰撞是如何发生的,它发生的位置等等,然后你问一个它从未遇到过的问题,它实际上能够解决。
这些是大型语言模型的一些有趣特性,使它们成为构建各种技术的有趣工具。接下来,让我们讨论大型语言模型在商业智能领域的应用。
「🔍」大型语言模型在商业智能中的应用
现在,让我们深入了解大型语言模型在商业智能中的应用。这里有几个主要的应用方面:
1. 自然语言搜索与生成答案
一个重要的应用是通过自然语言搜索和自动生成答案,让最终用户能够用他们真实的语言提出问题,并获得他们所寻找的洞察。比如,他们可以问类似“我这三个月在亚洲的前十个产品是什么?”这样的问题,然后系统会给出直观的可视化答案。这使得商业智能分析对于所有人都更加可访问。
优点:
- 具有更低的技术门槛,无需编写复杂的查询语句
- 提供直观的可视化答案,使数据更易理解
缺点:
- 存在幻觉问题,可能会给出错误或模棱两可的答案
- 缺乏对企业内部数据和领域专业知识的理解
2. AI辅助的数据建模
另一个应用是AI辅助的数据建模,通过使用大型语言模型中的世界知识来加速建模的过程。通常情况下,建立一个成功的商业智能系统需要花费大量的时间来进行数据建模,以了解数据的组织方式、常见的问题类型和所需的计算方法。通过利用大型语言模型中的世界知识,可以显著加快这一过程,减少繁琐的手工工作。
优点:
- 减少数据建模的时间和工作量
- 提高数据建模的准确性和一致性
缺点:
- 需要对大型语言模型进行训练和调优,以适应不同的业务场景和数据集
- 需要确保模型对企业内部数据具有有效性和可解释性
3. AI搜索推荐
AI搜索推荐提供了一种快速入门的方式,为用户提供种子问题,帮助用户进入自己感兴趣的领域,并了解可以问什么样的问题。这样,用户在使用商业智能工具时会得到更多的辅助和指导。
优点:
- 帮助用户理解可以提出的问题类型
- 提供领域相关的种子问题,减少搜索时间
缺点:
- 需要提供准确的种子问题,以确保用户能获得有价值的反馈
- 对模型进行培训和优化,以适应用户的常见搜索模式和行为
4. 会话式AI和Co-pilot体验
会话式AI和Co-pilot体验是未来商业智能产品的一个重要发展方向。通过结合聊天机器人和数据可视化工具,用户可以通过自然的对话方式与图表进行交互和探索。这种交互式体验可以帮助用户更好地理解和分析数据,并通过以对话方式提供指导和建议的AI助手进行支持。
优点:
- 增强用户体验,使用户更容易进行数据分析
- 提供实时反馈和指导,帮助用户更好地理解数据
缺点:
- 需要设计和开发复杂的对话系统,以确保用户有一流的体验
- 需要训练模型以适应不同的用户用例和数据集
这些是大型语言模型在商业智能中的几个关键应用领域。接下来,让我们探讨商业智能产品的未来发展。
「✨」商业智能产品的未来发展
商业智能产品正在不断发展和演变。以下是几个值得关注的趋势和发展方向:
1. 用户以自然语言提问
未来的趋势是允许用户以自然语言提出问题。商业智能产品应该能够理解和解释用户的问题,并以直观和可视化的方式提供答案。这将使更多的用户能够从数据中获得洞察,而无需事先具备分析师级别的技术知识。
优点:
- 降低技术门槛,使更多的用户能够使用商业智能工具
- 提供直观和可视化的答案,使数据更易于理解
缺点:
- 需要训练和优化模型以适应不同的问题类型和数据集
- 依赖准确的自然语言处理和理解技术,以确保正确的解释和回答
2. 数据可视化与分析
用户对数据可视化和分析工具的需求将继续增长。商业智能产品应该提供丰富的可视化功能和分析工具,帮助用户更好地理解和分析数据。这将使用户能够更好地发现数据中的模式和趋势,并从中获得有价值的洞察。
优点:
- 提供丰富的可视化功能和分析工具,使用户能够更好地理解数据
- 帮助用户发现数据中的模式和趋势,提供有价值的洞察
缺点:
- 需要设计和开发复杂的可视化和分析工具,以满足用户的需求
- 需要处理大量的数据,并提供实时的可视化和分析功能
3. 数据建模的加速和简化
数据建模是构建成功的商业智能部署的关键步骤之一。未来的趋势是通过使用大型语言模型和AI辅助工作流来加速和简化数据建模的过程。这将使用户能够更快地创建商业智能应用程序,并利用大型语言模型中的世界知识进行数据建模。
优点:
- 减少数据建模的时间和工作量
- 利用大型语言模型中的世界知识快速创建商业智能应用程序
缺点:
- 需要训练和调优模型以适应不同的业务场景和数据集
- 需要确保模型对企业内部数据具有效用和可解释性
4. 数据分析师的转型角色
商业智能产品的发展还将推动数据分析师角色的演变。分析师将不再只是提供数据报表和分析结果,而是更多地参与业务决策和战略制定过程。他们将需要综合理解数据、技术和业务,成为组织中数据驱动决策的支持者和教练。
优点:
- 将分析师从繁杂的数据任务中解放出来,更多地参与业务决策和战略制定
- 增强分析师的价值和影响力,使其能够更好地为组织创造价值
缺点:
- 需要培训分析师,使其更好地理解数据、技术和业务
- 需要建立良好的组织文化,促进数据驱动的决策和合作
这些是商业智能产品未来发展的一些关键趋势。但与此同时,大型语言模型也面临一些挑战,让我们来深入了解并探讨相应的解决方案。
「⚡」大型语言模型的挑战与解决方案
尽管大型语言模型有许多特点和优势,但也面临一些挑战。以下是一些主要的挑战以及相应的解决方案:
1. 幻觉问题
幻觉问题是大型语言模型常见的问题之一。当你提出一个模型无法回答的问题时,它可能会回答一个错误且有信心的答案。在商业智能领域,这可能会导致日期筛选器等问题的错误生成,或者在企业内部的某个特定上下文中误解一些不属于公共领域的事物。
解决方案:为大型语言模型提供用户反馈和修正的机制,确保用户对输出结果进行验证和纠正。同时对模型进行训练和优化,以提高准确性和可靠性。
2. 缺乏领域专业知识
大型语言模型通常是基于公共数据进行训练的,它们可能对于企业特定的指标名称、数据列的重要性以及上下文缺乏专业知识。这导致它们无法正确地理解和回答与企业内部数据和业务相关的问题。
解决方案:在大型语言模型中引入业务领域的专业知识,进行定制化的训练和优化,以确保模型能够适应特定的企业环境和数据集。
3. 个性化需求与定制化建模
每个用户的需求都是不同的,大型语言模型需要能够个性化地适应用户的需求并进行定制化的建模。每个用户都有自己特定的数据、问题类型和分析目标,需要一种能够根据用户的反馈和需求进行定制化训练和调整的方法。
解决方案:为用户提供反馈和修正的机制,根据用户的反馈进行个性化的模型定制化训练,以满足不同用户的需求。
4. 用户体验的提升与交互设计
大型语言模型对语言理解和推理的能力在理论上非常强大,但用户体验的设计需要更多的工作。用户希望能够完全控制模型,而不是被一些概率性的系统所左右。
解决方案:设计和开发与大型语言模型相匹配的交互式用户体验,使用户能够全程参与和控制分析过程,并确保用户对结果的信任和理解。
这些是大型语言模型面临的一些挑战,以及相应的解决方案。通过不断改进和创新,我们相信大型语言模型将在商业智能领域发挥越来越重要的作用,为用户带来更好的分析体验和价值。
结论
总的来说,大型语言模型在商业智能领域具有巨大潜力。它们能够加强自然语言搜索和生成答案的能力,加速数据建模的过程,提供个性化推荐和辅助分析,不断升级和改进用户体验。然而,大型语言模型也面临一些挑战,例如幻觉问题和缺乏领域专业知识。通过与用户的合作和反馈,以及定制化训练和优化,可以克服这些问题并逐步改进模型性能。
在未来,商业智能产品将继续发展和创新,为用户提供更好的分析工具和体验。用户将能够更轻松地提问,更深入地分析数据,更好地理解业务和数据之间的关系。数据分析师的角色也将发生变化,从仅仅生成报表和分析结果,转变为业务决策和战略制定的支持者和教练。
让我们共同期待未来商业智能的发展,并不断追求创新和改进,为用户带来更好的数据洞察和价值。