首页 > 快讯 >

微软推出微型AI自动编码模型phi-1,击败 GPT-3.5

2023-06-26 12:07:25 来源:站长之家

编程客栈()6月26日 消息:微软的人工智能研究人员发布了一种新的、轻量级的代码生成模型 phi-1,并且其性能优于 ChatGPT 背后的大型语言模型 GPT-3.5。


【资料图】

据了解, 这个基于 Transformer 的模型仅拥有13亿个参数,相比之下,Codex拥有120亿个参数。

微软的研究人员仅用了四天时间就使用 Nvidia 的8个 A100芯片来训练 phi-1。该模型使用来自网络的60亿个token以及使用 GPT-3.5生成的另外10亿个token进行训练。

在性能方面,phi-1在HumanEval基准测试中获得了50.6% 的 pass@1准确率。尽管模型小得多,但微软模型击败了 Hugging Face 和 ServiceNow 的 StarCoder (33.6%)、OpenAI 的 GPT-3.5(47%) 和谷歌的 PaLM2-S 编程客栈(37.6% ) 。

在MBPP pass@1测试中,phi-1表现更好,取得了55.5% 的分数。上述许多模型尚未发布该基准测试的结果,但 WizardLM 的WizardCoder在本月早些时候进行的测试中得分为51.5%。WizardCoder 是一个150亿个参数模型,而 phi-1的参数模型为13亿个。

高质量数据带来差异

微软的研究人员认为,正是“高质量数据的力量”让 phi-1表现如此出色。为了说明这一点,研究人员将他们模型的论文js命名为“教科书就是你所需要的”。

他们写道:“正如一本全面、精心制作的教科书可以为学生提供掌握新学科所需的知识一样,我们的工作展示了高质量数据在磨练语言模型在代码生成任务中的熟练程度方面的显着影响。” 。

“通过制作‘教科书质量’数据,我们能够训练出一个模型,尽管模型大php小缩小了10倍,数据集大小缩小了100倍,但在编码基准(例如 HumanEval 和 MBPP)上,该模型超越了几乎所有开源模型。”

与其他可用的编码模型相比,Phi-1仅限于 python 编javascript码。他们表示,该模型的局限性还在于它缺乏大型模型的特定领域知识,例如使用特定 API 进行编程。

为了扩展他们的工作,微软的研究人员建议使用 GPT-4而不是 GPT-3.5来生成用于模型训练的合成数据。

研究人员还将寻求提高数据集的多样性和非重复性,尽管该团队表示,他们必须找到方法“在数据生成过程中注入随机性和创造力,同时仍然保持示例的质量和连贯性。”

上一篇:

今日快看!燃气板块异动拉升

下一篇:

最后一页

x
推荐阅读

微软推出微型AI自动编码模型phi-1,击败 GPT-3.5

今日快看!燃气板块异动拉升

陆川到南宁的动车几点钟

2023安徽黄山市黟县国有投资有限公司人才招聘面试公告_全球观焦点

成都市武侯区火车南站街道开展禁毒知识竞赛活动-世界视讯

6月25日西北地区地炼汽柴油报价下滑

福建南平可提供阿里斯顿抽油烟机维修服务地址在哪 天天热文

热议:《火焰之纹章》漫画将与 Switch 版本互补

中海物业管理有限公司_中海物业

世界微速讯:鲸鱼湾公立中学_关于鲸鱼湾公立中学简述

当前动态:三年级重量单位换算题100道答案及过程 三年级重量单位换算题100道

亚瑟士 kayano 23怎么样 认识亚瑟士产品特点 今日视点

特斯拉创建 Tesla AI 推特账户,称下月开始生产 Dojo 超级计算机

环球新动态:中央气象台:华北黄淮等地高温天气将有所减弱 江南华南降雨26日后减弱

神城卡莲|全球快播

炒股养家交割单复盘图解 炒股养家交割单 环球聚看点

台州4所高校2023年招生计划来了!|每日热门

解说一部经典犯罪片《惊世狂花》_惊世狂花未删减版-全球聚焦

一千零一夜的好词好句有哪些我要抄_一千零一夜好词好句好段摘抄大全|环球快报

迈阿密国际老板贝克汉姆社媒晒图,祝梅西36岁生日快乐|世界最资讯

徐静蕾本人首次回应生娃传闻,晒近照明显发福,脸都胖圆了_全球热点评

天天速讯:通州公安全力排查隐患

现场直击,大咖云集!2024 中国商学院招生巡展成功举办

马德兴:世预赛亚洲区大势敲定,国足36强赛11月战第三第四档队

十五的月亮像什么一样挂在天上 十五的月亮像什么

原厂越野改装!马自达BT-50新版本官图-天天快看

太惨烈!6人死亡,浙江一地发生特大交通事故,有何相关法律要点-聚看点

痛心!南京大屠杀幸存者高恒发去世 享年97岁_世界热讯

【世界速看料】男乳女化是什么意思_什么是男性女乳症

圆通快递单号有几位数_圆通快递单号12位数 环球要闻

世界热资讯!建业地产:全面停止境外债务支付 尽快出台整体解决方案

长影乐团轻音乐团献唱潍坊大剧院 全球球精选

世界观焦点:国泰航空突发!中止起飞 多人受伤

每日观点:重视癌症早筛——天津医院健康管理科开展癌症早期筛查项目

【新视野】今日凌晨,北部湾发生5.0级地震,震中距海口155公里

三签约达成:拜仁白菜价签约格雷罗,切尔西签下杰克逊,皇马与塞瓦略斯续约

【白斑热议】西安能正规治疗白癜风的医院|口碑

热点!成长记录手册自我回顾_自我回顾

8-4!亚少赛八强诞生!日澳对决韩国VS泰国 前四进世少赛 世界最新

全网最全“马斯克预言”,不敢多看|全球热闻

新华全媒+丨北方多地积极防范应对端午假期高温天气|世界微头条

辽宁弘侨生物科技股份有限公司_辽宁弘侨生物科技股份有限公司

肝不好有哪些症状吃什么药_胆不好有哪些症状

制作“粽子不倒翁”、艾草香丸……博物馆的端午体验活动丰富多彩

热议:名人传-窦 建 德

百位陶瓷艺术家汇聚,首届酒店瓷博会将在沪亮相

高考成绩陆续公布 各地推出多种方式服务考生志愿填报

全球通讯!热热热热热!高温橙色预警,来了

当前快看:长形脸适合什么发型男_长形脸适合什么发型

端午“粽”头戏 海口秀英区推出三条假期旅游线路