博鱼【宅男财经|首席面对面】近日,OpenAI发布GPT-4的迭代版本——GPT-4o,它表现出多模态理解和输出能力博鱼(中国)官方网站-BOYU SPORTS,能够跨声音、文本和视觉进行智能推理并与用户展开对线o有哪些特点?将会对行业产生哪些影响?
中信建投人工智能首席分析师于芳博表示,GPT-4o纳入了语音模态信息,而语音对话的大模型其实是由多个模型构成,它是先将语音转化成文字,再通过文字大模型进行推理计算,最后将内容转化成语音输出。通常这一过程耗时较长,上一代GPT-4的语音对线o实现了语音直接输入和输出,这个过程中不再有内部转写的流程,因此它的延迟就大幅降低至200多毫秒。同时博鱼(中国)官方网站-BOYU SPORTS,GPT-4o还推出免费版本,背后其实是大模型在算力架构不停优化后,推理成本进一步下降,这也使得越来越多的免费应用出现。
谈及国内大模型发展情况,于芳博称,当前很多国内大模型的能力已经逼近GPT-4。GPT-4发布后博鱼(中国)官方网站-BOYU SPORTS,海外出现一波流量和应用爆发的过程,而国内大模型在今年3月和4月的流量增速也很快,特别是生成式人工智能,并且相关公司的融资在一季度同比增长50%以上博鱼(中国)官方网站-BOYU SPORTS博鱼(中国)官方网站-BOYU SPORTS,环比增长也在40%以上,越来越多的大模型在不断涌现,能力也越来越逼近GPT-4,流量和应用也迎来爆发。
于芳博认为,无论是OpenAI还是国内的大模型,创新使得成本降低、效果更好,相信未来新的智能设备和应用将会不断涌现。