GPT-4o被全球网友玩坏了 谷歌:终究是错付了!

GPT-4o被全球网友玩坏了 谷歌:终究是错付了!

    正在检查是否收录...

在社交软件上,OpenAI的GPT-4o成为了热议的焦点。这款最新旗舰产品以其全能的特性——接受文字、音频、图像的任意组合输入,并生成相应的文字、音频、图像输出——迅速吸引了全球网友的关注。GPT-4o的免费特性更是让其成为了互联网上的新宠。

在5月14日的官方演示中,GPT-4o展现出了令人印象深刻的性能,其响应音频输入的速度甚至与人类相媲美。网友们已经迫不及待地开始尝试这款AI的多种功能,从生成图表和统计分析到创建3D模型的STL文件,GPT-4o都能在极短的时间内完成。

GPT-4o的应用场景多种多样,网友们的创意层出不穷。例如,有网友使用GPT-4o解答了著名的“爱因斯坦谜题”,展示了其强大的逻辑推理能力。此外,还有网友利用GPT-4o开发了自动选股器,将复杂的选股指标自动改写成选股器,并输出图表和数据归档,极大地提高了效率。

GPT-4o的纸质原型转录功能也受到了网友的好评。有网友尝试将手写的原型转录为电脑内的初始HTML,GPT-4o不仅准确地完成了任务,还保持了数据结构变化时的HTML更新。此外,GPT-4o的OCR(光学字符识别)能力也得到了认可,它能够识别并吐出连人类都难以辨认的图像中的内容。

以下是GPT-4o的一些亮点功能:

多模态输入输出:GPT-4o能够接受文字、音频、图像的任意组合作为输入,并生成相应的文字、音频、图像输出。

逻辑能力测试:GPT-4o成功解答了被称为“爱因斯坦谜题”的逻辑题,展示了其出色的逻辑推理能力。

自动选股器:尽管OpenAI表明GPT不能用于选股,但网友使用GPT-4o创建了一个自动选股器,并能输出图表和数据归档。

纸质原型转录:网友利用GPT-4o将纸质原型转录为电脑内的初始HTML,大大节省了开发时间。

OCR能力:GPT-4o展现了其强大的光学字符识别(OCR)能力,能够识别复杂图像中的文字。

在GPT-4o发布的同时,谷歌也推出了自己的大模型产品Project Astra。尽管Project Astra同样具备强大的功能,但有专家指出,谷歌的产品在多模态输出方面仍有待提高。虽然OpenAI和谷歌都先后推出重磅产品,但这波比拼,谷歌可以说是一点好处都没捞着,直接被OpenAI“艳压”了。

与此同时,马斯克旗下的xAI公司推出的Grok模型在某些测试中表现超过了GPT-4o,比如它正确回答了Ilya离开公司的问题。而OpenAI自己的大模型未能提供正确响应。

gptgpt-4openaiocrhtml大模型多模态逻辑推理光学字符识别3d模型统计分析互联网
  • 本文作者:李琛
  • 本文链接: https://wapzz.net/post-13973.html
  • 版权声明:本博客所有文章除特别声明外,均默认采用 CC BY-NC-SA 4.0 许可协议。
本站部分内容来源于网络转载,仅供学习交流使用。如涉及版权问题,请及时联系我们,我们将第一时间处理。
文章很赞!支持一下吧 还没有人为TA充电
为TA充电
还没有人为TA充电
0
  • 支付宝打赏
    支付宝扫一扫
  • 微信打赏
    微信扫一扫
感谢支持
文章很赞!支持一下吧
关于作者
2.3W+
5
0
1
WAP站长官方

云图AI:建筑设计师效率工具 快速批量生成设计效果图

上一篇

一文读懂主流领先的 SLM(小型语言模型)

下一篇
  • 复制图片
按住ctrl可打开默认菜单