加入收藏 | 设为首页 | 会员中心 | 我要投稿 汽车网 (https://www.0577qiche.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 站长资讯 > 外闻 > 正文

AI大模型新进化点:让GPT-4造工具给GPT-3.5用

发布时间:2023-06-06 09:52:39 所属栏目:外闻 来源:
导读:人类是从制造工具以应对新的挑战而获得进化的,人们现在让LLM通过制造工具来变得更强大,不仅加强了LLM灵活解决难题的能力,还能为消费者提供最高效率、实惠的解决方案。

一、让强大模型自制工具,让轻量级模型使
人类是从制造工具以应对新的挑战而获得进化的,人们现在让LLM通过制造工具来变得更强大,不仅加强了LLM灵活解决难题的能力,还能为消费者提供最高效率、实惠的解决方案。

一、让强大模型自制工具,让轻量级模型使用工具解决问题

LATM能够根据具体使用场景来分配LLM的使用,包括工具制造、工具使用两个环节:

1、使用性能强大、价格昂贵的模型作为工具制造者,如GPT-4,从任务实例中创建一个可复用的工具;

2、使用轻量级、较为便宜的模型充当工具使用者,如GPT-3.5 Turbo,执行相对简单的使用任务,即用已验证的工具来解决请求中的相似实例。

这种模式让轻量级模型拥有与强大模型相当的性能,同时保持更高的成本效率。可用于各类重复性任务,如对Web文档的解析与分析、寻找游戏攻略。

工具制作分为以下几个步骤:工具提出、验证和封装。由于每类任务只需执行一次,所生成的工具可重复用于该任务的所有实例。与单独使用强大的模型相比, LATM具有更强的效率和成本效益。

此外,Python函数工具是一种更通用的思维形式,能够增强LLM的整体实用性和灵活性。

他们还引入了第三个模块,一个轻量级的LLM以充当调度程序(the dispatcher),它可以决定是否能使用现有应用解决传入的原因,或者是不是需要创建新工具。

二、LATM能够解决复杂问题,最终效果堪比强大模型

该团队使用GPT-4 作为代表性的工具制造者、GPT-3.5 Turbo作为代表性的工具使用者,在六个不同领域的数据集上评估了LATM的可行性,包括逻辑演绎、跟踪洗牌对象、Dyck语言、词排序、中文剩余定理和会议调度,最终证实了:

1、GPT-4作为工具制造者,该模型经常设计出合适的问题解决工具;

2、像GPT-3.5 Turbo这样的轻量级模型可以实现与GPT-4相同的性能且平均成本更低,显示了LATM在提高轻量级模型性能方面的有效性;

3、调度程序可以有效识别现有工具,并根据需要请求新工具的创建。

但在该团队的评估过程中,他们还发现:

1、对于十分困难的任务,因此,制作解决工具不仅要利用高性能的强大模型,而且要利用精密数据的集合;

2、对于较为简单的任务,工具制造者可以是一个轻量级的LLM。

LATM创新性地整合两类LLM,并分配到两个关键阶段,使LLM能够创建和利用自己的工具来完成各种任务,这种计算方式在充分利用前沿 LLM能力的同时,能大幅度降低计算成本,帮助人工智能系统得以研发成功,同时也释放了大量商机。

而研究中对数据集缺乏的探究或将刺激研究界创建高精度的数据集,进而有助于培养下一代人工智能系统。

(编辑:汽车网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章