AI创造AI,ChatGPT击败街头霸王2!

Find AI Tools
No difficulty
No complicated process
Find ai tools

AI创造AI,ChatGPT击败街头霸王2!

目录

  1. 引言
  2. AI创造AI的故事
  3. 发现游戏古迹
  4. 从GPT-4到Auto-GPT
  5. AI学习之路
  6. 打败恐怖的AI
  7. 颠覆游戏历史
  8. 向AI时代迈进
  9. 结语
  10. FAQ

引言

大家好,我是Yi。今天我想和大家分享一个关于AI的故事。我曾经让一个AI帮我创造另一个AI,然后我们联手打败了童年时期让我困扰的《街头霸王II》中的古老AI。在这个过程中,我们无意间揭开了街机游戏历史中的一段黑暗之谜。我将所有的代码都公开了,所以在观看视频之后,你可以在自己的电脑上尝试运行它。在本视频的最后,我还会分享一个我无意中在《街头霸王II》中发现的秘密。如果没有这个AI,我可能永远不会知道我在童年时被骗得有多惨。几个月前,我发现在高难度下通关《街头霸王II》可以解锁一个隐藏结局,而在低难度下只能看到公司的名字。但是,经过半年的努力和摔坏了几个手柄后,我仍然无法打败游戏。所以当ChatGPT变得流行起来的时候,我想知道是否可以用它来创建一个AI,来玩格斗游戏并打败《街头霸王II》中的AI。现在,ChatGPT的基础模型已经升级为GPT-4,大大提高了它的功能。我经常使用它,我的电脑几乎总是打开一个聊天窗口。有了这个想法,我所需要的只是输入几个按键。老实说,我这么做有点儿玩味,但是在看到AI的回答之后,我不禁感到惊讶。我一直知道GPT-4擅长编写小脚本和程序,但我从未想过它能处理如此复杂的AI项目。为了使代码适应有限的响应长度,GPT-4巧妙地选择了使用现有的开源代码库,并只需几行命令就能调用其他人编写的数千行代码。它不仅仅给了我一个脚本,还提供了运行它的指导和需要改进的方面。下面的过程涉及在我的电脑上运行GPT-4的代码,将任何错误消息发送回GPT-4,并让它进行改进。老实说,我觉得自己有点多余。毕竟,GPT-4可以直接与我的电脑通信,那我的角色是什么呢?

AI创造AI的故事

可以说,第一个版本的AI确实是由GPT-4一点一点地编写的。我已经将所有的这些聊天记录上传到了我的开源项目中。GPT-4最终创建的产品是一个复杂的格斗游戏AI项目,包含了几个代码文件。这个格斗AI能够读取游戏屏幕,并根据视觉信息在其神经网络中做出决策,从而产生按钮按下的动作。从本质上讲,它像一个人一样玩游戏,盯着屏幕,使用手柄。当然,专业玩家和像我这样的新手之间有很大的差别,AI的“大脑”正是在这里发挥作用。为了向AI的“大脑”灌输知识,GPT-4还编写了一个训练程序,通过多次战斗逐渐提升神经网络的能力。AI必须从零开始学习,理解丰富多彩的图像、它的目标、它所控制的角色、对手是谁、对手的动作意味着什么、对手充能时应该怎么做以及如何赢得游戏。但就在AI开始学习之后不久,问题出现了。我有一个在最终BOSS战前保存的游戏进度,并且格斗AI的训练就是反复挑战这个身穿红衣的战斗AI。然而,从实时训练输出中,我们可以看到我们的格斗AI的平均得分正在下降,而每轮的平均持续时间正在增加。你能猜到为什么吗?很简单,AI变得“胆小”了。如果你在这个阶段测试AI,你会清楚地看到它对BOSS的恐惧。它一直在后退和跳跃,甚至不敢靠近,更不用说朝对手的脸上出拳了。如果连攻击都无法进行,AI怎么能学会战斗呢?果不其然,经过900万个训练步骤后,平均战斗时间开始减少,AI一无所获,被彻底击败。我告诉GPT-4我们可怜的小AI的情况,但它只是无助地看着它的“孩子”被打得落花流水,并没有给出任何具体的代码改进建议。然而,我不能袖手旁观。虽然我没有编写代码,但我花了很多时间来传递信息,我对这个AI的“孩子”产生了一种连结。再加上我被《街头霸王II》中的AI打败了半年之久,不计算我童年时的经历,我只是想看到它输一次。无论是我还是我们的AI“孩子”谁赢了都不重要。

发现游戏古迹

接下来,你将见证一位格斗大师的激动人心的重归故里的故事,只不过这一次,主角不是一个人,而是一个AI。这个AI最终解开了传奇隐藏结局的谜题,无意中揭示了游戏历史中的一个黑暗秘密。在这一部分中,我扮演了更重要的角色,将AI训练得如此高超的关键在于它的“大脑”,即如何填充它的神经网络,使其充满知识和经验。这属于我不熟悉的强化学习领域,但幸运的是,我有GPT-4的帮助。GPT-4已经教给了我很多东西,并为我的学习路径提供了一个完整的运行项目起点,使整个过程更加容易。GPT-4在我的学习过程中起着至关重要的作用,它完全消除了语言障碍。我终于回到了我的母语-中文,进行学术研究。根据我的电脑文件的时间戳,我在4月1日至4日的假期中阅读了11篇英文文章,其中包括6篇学术论文。如果没有GPT-4,作为一个讲中文的人,要彻底阅读只有一篇英文论文就需要比四天更长的时间。虽然我的英语发音可能有些奇怪,但我的阅读能力相当不错。我在GRE考试的语文推理部分得了160分。从大学开始,我的学术语言,包括阅读和写作,一直是英文。但是GPT-4最终让我能够用母语进行学习。如果你仔细看,你甚至会在对话记录中找到俄语和土耳其语的文章。在AI时代,语言障碍已经过去了,我们可以使用最有效的语言,所以我回到了我的母语-中文,以便学习。当然,GPT-4的帮助不仅仅是打破语言障碍,我还要求它简化论文中的复杂概念,以便甚至中学生都能理解。如果我还是不懂,我可以提问,GPT-4会根据原始论文提供可靠的答案支持。有了GPT-4的帮助,我的学习速度提高了六到八倍,这是一个保守的估计,因为我还花时间改善项目本身,比如解决AI缺乏勇气的问题。我读过的六篇论文中,有一篇专门讨论了这个现象。当我们的AI开始训练时,它没有任何知识,所以经常输多于赢是正常的。然而,这导致AI不断受到惩罚,永远没有机会学习正确的动作,最终无助地后退、失去希望、接受失败。为了解决这个恶性循环,该论文建议给予AI应得的回报。例如,如果AI输给了对手,应考虑所受到的伤害。造成的伤害越大,扣分越少。如果AI几乎击败了对手,甚至应该得到额外的加分。然而,这需要对项目中的整个奖惩系统进行重写。但是,一旦我开始做这个,我意识到我几乎没有写过代码,多亏了GitHub COPILOT,一个可以自动写代码的AI,同样由GPT-4驱动。这一次,我在代码编辑器中与GPT-4进行交互,而不是在聊天窗口中。我只需大致描述每个步骤,GPT-4就会为我快速生成一些代码块。很难确定哪一行代码是我自己写的。在仅仅一天的时间内,GPT-4和我彻底改写了格斗AI的代码。有了公平的回报,我们的AI迅速转入了更具攻击性的模式,我真实地目睹了AI的可怕学习能力。经过改进的格斗AI可以同时在16个游戏窗口中训练,速度是以前的七倍。经过1小时43分钟,它积累了194小时的实际战斗经验。这只是使用一张显卡,如果有100张,甚至10000张呢?AI可能没有人类那么“聪明”,但没有人能比得上AI的“勤奋”。我再次测试了经过训练的AI,情况发生了翻天覆地的变化。从视觉上看,我们的格斗AI完全压倒了对手,连击不断,甚至不给对手反击的机会。这个曾经在半年多时间里打败我的复古游戏AI,竟然被打得这么惨,真是令人满意。但是,在《街头霸王II》中,你需要在三局两胜的情况下才能真正晋级。在第二局中,尽管我们的AI造成了重大伤害,但它没有第一局那么大的势头,最终还是输了。回头看训练曲线,我意识到这是“过拟合”的情况。简单来说,AI的“专长”太过专一。尽管最终BOSS让我在半年的噩梦中折磨了一段时间,但古老AI对于我们新升级的AI的强大学习能力来说还是太弱,太容易被解读了。更糟糕的是,我在训练中使用了保存的游戏进度,来自最终阶段的第一轮。AI反复训练这一轮,对手的起手动作总是一样的。训练曲线显示,大约在40分钟后,AI发现了它的最终策略。它花了接下来的一个小时来完善它,不断提高连招的成功率。然而,在这个过程中,对手的反应变得越来越单一,让AI只能依靠这个特定策略,并忘记了对手在其他情况下的复杂行为。所以,当轮次变化时,对手切换到了新的一套起手动作,我们的AI就不知所措了。然而,这个问题很容易解决,可以将训练回滚到第37分钟的第2500000步。在这个时刻,AI的连招已经成形,在第一轮中的胜率很高,同时还记得如何应对复杂的情况。这使得它能够适应第二和第三轮。我只让AI尝试了两次,在第二次尝试中,它成功赢得了两局中的两局,并晋级了。在第一轮中,我们的格斗AI的连招被对手的终结技打断,但仅过了十秒钟,它毫不费力地执行了一个干净利落的肩摔,击败了对手。在第二局中,我们的小AI奇怪地待在角落里,在《街头霸王II》中这是一个大错误,通常会导致“角落悲剧”。确实,我们的AI陷入了困境,但它仍然能够从BOSS身上夺取大量血量,展示出令人难以置信的角落战斗技巧。在最后一局中,AI再次选择了一种不合理的“自杀策略”,跳入角落。然而,仅仅15秒后,它展示了这种奇怪战术的美妙之处。AI诱使BOSS执行“肩摔”动作,肩摔是《街头霸王II》中需要精确的时间和位置的一种动作,但由于其难度而造成的伤害极大。很明显,我们的小AI在角落中发现了执行肩摔的秘诀。它在第一轮中使用肩摔作为获胜的招数,并在这一最后一轮中连续发动了两次肩摔,让BOSS只剩下微弱的血量。这样一个难以触发的动作连续出现三次,只能归功于AI的技能。当我们的AI即将以高难度解锁隐藏结局时,疯狂的BOSS揭示了游戏历史中的黑暗篇章,这是无数儿童所经历的,原来这个噩梦AI是一个作弊者。线上一直有传言,通过增加难度甚至让游戏内的AI作弊,街机游戏是为了赚钱而设计的。这一次,我们的小AI用自己的能力证明了这个理论。当最终BOSS只剩下一点血量时,它在短短四秒钟内发动了四个终结技,而理论上每发动一次至少需要两秒钟。我们的AI用超过人类理解力的反应速度躲开了BOSS的四个终结技,恰到好处地在最后一击后给予了致命的打击。它不仅击败了困扰我童年时期和最近几个月的噩梦AI,还成功地揭示了游戏历史中的这个黑暗秘密。最后,我用GPT-4创造的这个小AI,帮助我实现了童年时代的梦想,看到了《街头霸王II》的隐藏结局。这个项目中的所有代码,包括我与GPT-4的对话,都已经上传到了我的公共代码库中。它是根据Apache-2.0许可证开源的,所以任何人都可以免费使用它。我计划做更多类似的项目,以帮助每个人在这个前所未有的AI时代保持更新。在《街头霸王II》的隐藏结局中,主角没有宣称任何奖品,而是迫切寻求下一个挑战。AI时代带来了许多不确定性和新的挑战。不管挑战存在多久,永无止境,我们不必害怕。保持警醒,继续思考,让我们一起前进,看看AI时代将揭示出怎样的景象。今天的视频就到这里。你的点赞和订阅会让我非常开心。我是Yi,我们下次再见。

FAQ

Q:AI如何帮助我打败《街头霸王II》中的AI? A:通过创造一个AI来玩格斗游戏,并通过大量的训练和学习,最终击败了《街头霸王II》中的AI。

Q:GPT-4是什么? A:GPT-4是一个功能强大的AI模型,具有编写脚本和程序的能力。

Q:为什么AI在训练过程中变得“胆小”? A:在训练过程中,AI发现与最终BOSS对战的困难,导致其变得害怕,不敢攻击,无法学习正确的战斗策略。

Q:为什么AI的训练曲线显示平均得分下降,而平均持续时间增加? A:这是因为训练过程中,AI在与BOSS对战时表现不佳,导致平均得分下降,而平均持续时间增加。

Q:如何解决AI训练中的“过拟合”问题? A:通过回滚训练,使AI回到在学习到最终策略之前的状态,以保持对复杂情况的应对能力。

Q:AI是如何发现隐藏结局和游戏历史中的黑暗秘密的? A:通过连续击败最终BOSS,AI暴露了游戏中的作弊行为,揭示了游戏历史中的黑暗秘密。

Q:为什么作者将代码和对话上传到公共代码库? A:作者希望让其他人可以自由地使用和学习这个项目,以帮助大家在AI时代保持更新。

Q:AI对作者来说扮演了什么样的角色? A:虽然作者没有直接编写代码,但他在与GPT-4的交互中承担了传递信息和与AI“孩子”产生连接的角色。

Q:作者通过GPT-4在学术研究中使用了哪些语言? A:作者回到了他的母语-中文进行学术研究,大大加快了学习速度。

Q:AI如何帮助作者改进项目和解决AI缺乏勇气的问题? A:通过协助作者编写代码和提供改进建议,AI帮助作者改进了项目,并解决了AI缺乏勇气的问题。

Most people like

Are you spending too much time looking for ai tools?
App rating
4.9
AI Tools
100k+
Trusted Users
5000+
WHY YOU SHOULD CHOOSE TOOLIFY

TOOLIFY is the best ai tool source.