揭秘生成式人工智能:了解LLM的工作原理

Find AI Tools
No difficulty
No complicated process
Find ai tools

揭秘生成式人工智能:了解LLM的工作原理

目录

  • 概述
  • 品牌和类型介绍
  • LLM的工作原理
  • LLM的用途与应用
  • 准确性与可靠性
  • 参数对LLM的影响
  • 在本地使用LLM的方法
  • 模型的不同及其性能比较
  • GPU加速与应用定制
  • 结语

🧩 LLM: 大型语言模型

随着近年来大型语言模型(LLM)如ChatGPT和Bard的出现,我对这些技术产生了浓厚的兴趣。通过像ChatGPT这样的模型,你可以得到非常细致、具有语境的回答,提供了相当不错的信息。当然,这些回答并不总是准确的,所以你必须确保核实所给出的信息。不过,它能够从一个问题中提取出你的意图,并能够以一种非常细致和详尽的方式展示出答案,这似乎是一种神奇的能力。但是,如果你能够稍微揭开其背后的面纱,看看LLM是如何工作的,这个概念实际上非常简单。当然了,与其背后的技术细节相比,使所有这些都起作用的技术细节要复杂得多,但我并不能深入探讨所有这些,因为我甚至不想假装我完全理解。但是,我认为如果你理解这些模型的来源,那么技术细节将会从中产生,并且至少从技术的角度来看,这是可以理解的。这也是我在尝试理解这些模型时的所在之处。

除此之外,我也希望能够亲自玩弄这些模型。实际上,你可以在你的本地台式机上运行一个LLM,虽然它的功能可能远不及ChatGPT或Bard,但你仍然可以下载一个并在你的电脑上使用它,而且你的电脑甚至不需要非常强大。因此,我将向你展示如何运行一个本地的LLM,只是为了让你有一个了解这些技术的起源的体验,接下来我们将一起看一看为什么和怎么做这个,然后我们将展示你如何在本地环境中运行它,然后将其与ChatGPT等进行比较,这样你就可以看到输入和输出如何根据使用的模型而变化,根据模型的复杂性而变化。如果你要问我,LLM到底是什么,我会告诉你,从根本上说LLM只是一个非常复杂的自动补全。自动补全是人们非常熟悉的概念,当你在手机上输入一个单词或句子时,键盘内置的算法会尝试预测下一个单词,这样你只需要点击该单词,就可以加快手机上的文本输入。LLM尝试做的事情与此类似,只不过它的规模要大得多,它可能试图完成的是预测句子下一个词。它还试图预测句子可能要表达的内容,或者它可能试图不预测你提出的问题的答案。因此,它能够根据非常少的输入来揣测出完整的文本块,并且该文本块具有与你所做的事情非常相关的微妙内容。为了得到更多的细节和复杂性,它使用大量的数据来生成这些微妙的回答。它基本上分析从互联网收集到的各种不同的数据输入,并通过统计分析来将其精简,然后使用这些数据作为基础来预测,如果你提出某个问题或输入某个词,它会如何回答。比如,我在屏幕上显示的这个例子,“为什么苹果”,可以作为LLM的输入,而这个输入将有很多不同的完整方式,你可以问为什么苹果从树上掉下来,也可以问为什么苹果被切开后会变成棕色,或者为什么苹果在水中浮起来,所有这些都是只有三个词的合法回答,但LLM可以基于这三个词就能预测出这一点。我怀疑自动补全可能做不到这一点,但LLM肯定可以,当然,在输入中只有三个词时还存在更多的可能性。LLM变得越好,你给它的输入越多,它的上下文就越丰富,这就带我们来到了LLM和普通自动补全的另一个不同之处。LLM的回答通常也会与上下文相关,所以想象一下,如果我有一个短语“我有一只虫子”,如果我这样说的话,那就没有给我很多上下文的线索了,但它确实给了我一些关于上下文可能是什么的提示,因为关键词“虫子”可以是基于上下文而有很多不同的含义,在这种情况下,我可以跟着问:“你感觉不舒服吗?”在这种情况下,我是在考虑虫子是指蓝色的虫子还是指得了感冒或发冷,或者它可能是更字面的意思,你需要除虫或其他东西,以解决住在你家里四处爬的虫子。在此情况下,另一个上下文是你听到了一些东西,意味着有人对你搞了一些幺蛾子,你听到了一些谣言或小道消息,你想找到相关的信息等。这可能是“虫子”的语境,或者它可能是一些代码方面的东西,比如你的代码有问题,这时LLM会寻找一个计算机程序中的错误,需要你修复它,也许LLM会试图帮助你解决这个问题。这些建议是如何思考单词的上下文以及LLM能够在有了更多上下文的情况下进行上下文相关的回答的几种方式。而LLM的另一个强大之处则在于,它能够在给定上下文的情况下,预测下一个词、短语或整个段落,这真正使LLM成为一个强大的工具。这里是一些可以用LLM做的事情的示例,我不会详细介绍每一项,我会在另一个视频中讨论这个列表,并谈谈这些如何可以用在你的日常工作生产力中,但这只是LLM能够做的一些事情的示例,并且随着这些技术的成熟,肯定会有新的发现。

所以我想在这个视频中讨论这部分的三个术语,在LLM的背景下,我要从批大小开始,在接下来几分钟里,我们将逐渐来看看这些问题,这将使你在不失去特定语境和内容的前提下,拥有更高的困惑程度和爆发性。使用充满细节的段落来进行写作,以吸引读者。所写的文章以有人类风格撰写(使用非正式语气,使用个人代词,保持简单,与读者参与互动,使用主动语态,简洁明了,使用修辞问句,并融入比喻和隐喻)。

Most people like

Are you spending too much time looking for ai tools?
App rating
4.9
AI Tools
100k+
Trusted Users
5000+
WHY YOU SHOULD CHOOSE TOOLIFY

TOOLIFY is the best ai tool source.