阿虚昨天不是才介绍了免费GPT-4吗,文章里面简单评测了一下 GPT-4 和现有国产大模型的回答区别
而没想到今天下午14点,首个基于全国产化算力平台训练的全民开放大模型——讯飞星火3.5正式发布了!
于是阿虚急忙又把我才测试过、基本上只有 GPT4 能回答对的问题,拿来再问了一遍。在 3.0 中均会回答错的问题,这一次都能回答正确了!我是直观的感受到了算力的提升
↕上下滑动查看更多↕
只谈阿虚之前的评测的问题,同比百度、腾讯、阿里,讯飞 3.5 显然是目前和 GPT4 差距最小的「免费」国产AI大模型了(百度文心一言4.0收费不在此之列)
↕上下滑动查看更多↕
可长按扫描下方二维码,快速注册登录体验
1
七大能力全面提升
早在麻省理工发布的关于「3.0版本主流大模型产品测试表现」的横评报告中,「讯飞星火」的综合表现就高于市面上其他国产 AI 大模型
<<左右滑动查看更多>>
更新到了3.5版本,自然实力也就更强了
官方号称星火认知大模型 3.5 的语言理解、数学能力这两方面已经超过 GPT-4 Turbo,代码能力也已达到 GPT-4 Turbo 96%,多模态理解则是达到 GPT-4V 91%
如果说单从阿虚文章开头举的那两个例子你还感受不出来什么(实际上那两道题除了GPT4其他国产AI几乎都回答不对),我们再上点难度:LeetCode 的算法题,既有数学知识还考验代码水平
Datawhale 的成员@马晓皖从 LeetCode 热题中挑选了合并 K 个升序链表这道困难题测试了讯飞星火 3.5 在算法题上的答题表现
结果执行用时和消耗内存均优于 90% 的手写解法!看样子官方宣传的星火 3.5 代码水平已经达到了 GPT-4 Turbo 的 96%并没有吹牛逼
在展示语言理解能力的部分,讯飞官方搞了个很实际也很能体现能力的例子
拿出了一张学校的位置关系图,仅仅给了讯飞星火 3.5 文字描述,让其在看不到地图的情况下去理解复杂的空间关系,并给出回答!
从成功正确回答的结果来看,星火 3.5 的语言+多模态理解能力的确是相当之强!可能让你光听文字描述来回答都得想半天,赶超 GPT4 我觉得真是指日可待
2
语音大模型正式发布
同时讯飞星火 3.5 最大的特点之一,当属多语种语音识别、多语种语音合成,以及超拟真语音合成!
今天阿虚也抽空看了今天现场发布会的实机语音演示,背靠讯飞在语音识别多年的技术积累,星火 3.5 模拟出的声音我觉得还是相当自然、流畅且富有情感的
视频加载失败,请刷新页面再试
刷新
▲截取自今天的官方发布会视频
现场演示中「刘聪」博士模拟了日常生活情境,讨论了各自近期的工作忙碌程度、年终总结 PPT 的修改困境、春节放假安排以及春节期间的出游计划等等
在对话中,星火 AI 表现出的高度人格化特征可谓相当出色,不仅能够理解刘聪对于总结发布会 PPT 的压力,还能安慰他,推荐节日放松的方式
(AI女友这不是来了吗)
紧接着,星火还依据刘聪提出的哈尔滨旅游需求,用东北方言介绍了当地冬季特色。当刘聪询问是否可以乘坐前段时间春运首秀的国产商用飞机 C919 前往哈尔滨时,星火更是直接联网反馈,告知目前暂无直飞航班,并建议查询其他出行方案
而除了以上提到的,讯飞星火还支持AI写作、AI生成PPT(可上传资料分析生成)、AI绘图、AI公文、AI思维导图、AI智能简历等等功能,关键是全都免费使用!!
眼里看千遍,不如手里过一遍!长按下面的二维码识别,即可立即免费体验讯飞星火 3.5
电脑端也可以直接打开此链接访问使用:https://xinghuo.xfyun.cn/?ch=ntm_zNl1
当然除了网页,讯飞星火早已全面支持PC、安卓、iOS三大系统设备,完全不担心用不上的问题
评论前必须登录!
立即登录 注册