电子工程专辑刚刚介绍了《谷歌发布多模态大模型Gemini》,这是谷歌自称强于OpenAI技术的目前最强大的AI,然而据彭博社报道称,Google在关于"双子座"的性能视频演示中作假了。

电子工程专辑在昨日刚刚介绍了《谷歌发布多模态大模型Gemini》,这是谷歌自称强于OpenAI技术的目前最强大的AI,然而据彭博社报道称,Google在关于"双子座"的性能视频演示中作假了。

视频来源:Google Gemini AI演示

这段六分钟的视频展示了 Gemini 的多模态功能(例如,口语对话提示与图像识别相结合)。双子座似乎能快速识别图像(甚至是连线图片),在几秒钟内做出反应,并实时跟踪杯球游戏中的纸团。当然,人类可以做到所有这些,但这是一个能够识别并预测接下来会发生什么的人工智能。

彭博社专栏作家帕米-奥尔森(Parmy Olson)说,Google的"What the AI quack"视频中,Gemini 看起来能力非凡,也许能力太强了。

不过,视频描述中,Google有一个重要的免责声明:"为了演示的目的,延迟已经减少,双子座的输出已经缩短,以求简洁"。

这正是奥尔森不满意的地方。根据她在彭博社发表的文章,Google在被要求发表评论时承认,视频演示并不是通过语音提示实时进行的,而是使用了原始镜头中的静止图像帧,然后写出文字提示,让双子座做出回应。奥尔森写道:"这与Google似乎在暗示的内容大相径庭:人可以与双子座进行流畅的语音对话,同时双子座会实时观察并回应周围的世界。公平地说,Google公司经常编辑演示视频,尤其是许多公司希望避免现场演示带来的任何技术故障。稍作调整是常有的事。但是,Google在视频演示方面一直存在问题。人们曾怀疑Google的 Duplex 演示(还记得 Duplex 吗?Duplex 是一款人工智能语音助手,可以打电话给发廊和餐馆预订房间。而预先录制的人工智能模型视频往往会让人更加怀疑。"

在这种情况下,奥尔森认为Google是在"作秀",目的是误导人们,让他们不知道 Gemini 仍然落后于 OpenAI 的 GPT。

不过Google对此并不认同。当被问及演示的真实性时,Google指出了Google DeepMind 研究副总裁兼深度学习负责人 Oriol Vinyals(也是 Gemini 的联合负责人)的一篇文章,其中解释了团队是如何制作视频的。

Vinyals 说:"视频中的所有用户提示和输出都是真实的,为了简洁起见进行了缩短。视频展示了使用 Gemini 构建的多模式用户体验。我们制作它是为了激励开发人员。"

他补充说,团队给双子座提供了图片和文本,并要求它预测接下来会发生什么。

其他质疑

1、MMLU测试中,Gemini结果下面灰色小字标称CoT@32,展开来代表使用了思维链提示技巧、尝试了32次选最好结果。而作为对比的GPT-4,却是无提示词技巧、只尝试5次,这个标准下Gemini Ultra其实并不如GPT-4。

2、对于那段精彩视频,也有人从开篇的文字免责声明中发现了问题。机器学习讲师Santiago Valdarrama认为声明可能暗示了展示的是精心挑选的好结果,而且不是实时录制而是剪辑的。后来谷歌在一篇博客文章中解释了多模态交互过程,几乎承认了使用静态图片和多段提示词拼凑,才能达成这样的效果。

Gemini vs ChatGPT,谁是真正的强者?

虽然ChatGPT所用的大语言模型来自谷歌实验室,相当于对于AI来说,谷歌是最早投入,在模型方面,他是鼻祖。然而,AI的成熟度除了模型之外,还需要算力和时间。算力方面,相信谷歌不会输给OpenAI,但是时间方面,OpenAI已经从最初的ChatGPT3.0进化到了4.0,这其中成长了一年的时间,对于快速进化的AI来说,一年是非常非常重要的,而Gemini AI还是刚刚发布。

同时,目前Gemini Pro版本,还只能对标GPT-3.5,对标GPT-4的大杯Gemini Ultra,要明年才出。

此外,Gemini仅支持英文,中文和其他语言也需要明年了。

 

然而,更多人关心的是,Gemini AI是否一直免费?能否抛弃ChatGPT Plus每月20美元的账单?

这就引发另一个问题,谷歌能否创立一种新的AI商业模式,但是,目前来说,由于AI需要大量的算力投入,成本非常巨大,除非在性能上有了数个数量级的突破,否则人工智能技术依然没法像互联网一样采用免费模式。

责编:Challey
阅读全文,请先
您可能感兴趣
尽管边缘AI带来了巨大的潜力和机遇,但开发人员在实现过程中也面临着来自软件和硬件等诸多方面的挑战。因此,为开发者提供指引和信息,并考虑融合和统一各种工具的用户体验,以简化人工智能库的设计流程,是非常重要的。
最近AI标志性人物奥特曼和英特尔CEO基辛格做了一场炉边对谈,聊了聊AI发展究竟需要投入多少芯片、多少钱的问题。7万亿美刀?
加速基础设施战略也不例外。也许更重要的是,Marvell正在充实生态系统中的一个领域,这个领域往往被处理技术的闪亮进步所掩盖,但对实现生成式人工智能的下一阶段同样至关重要。如今的挑战是,如何随着人工智能模型的规模、用例以及最终的应用激增,还能持续保持在创新浪潮的前沿。
从这一系列有关2纳米芯片工艺的最新动态可以看出,在AI技术不断演进与发展的推动下,2纳米先进芯片工艺的竞争正愈演愈烈。未来,随着良品率、成本以及确保生产的可持续性等问题不断得到解决,2纳米芯片的时代正在加速到来。
尽管英伟达不断提升AI芯片的供应量,但仍然存在AI芯片短缺的问题。由此可见,AI技术和应用不断发展,仍对AI芯片具有庞大的需求。然而,在英伟达的业绩和股价持续向好,且受到华尔街追捧的同时,也有一些分析师对投资者发出警告。
随着生成式AI的登场与演进,越来越多的组织加速探索其相关业务价值。然而,内部部署基础设施是一个极高的门槛。本文作者的观点是,云技术将促进生成式AI的普及,因为蓬勃发展的云服务已将门槛大幅降低,初创公司和企业都能获得促进创新和推动变革的能力,可以说人人都将从中受益。现在是所有人该行动起来的时候了!
2023年纯电动车(BEV)排名仍由Tesla(特斯拉)夺冠,市占率19.9%,比亚迪位居第二,紧追在后,比亚迪与特斯拉的全年销量落差已缩小至24.8万辆。
2023年第四季度,华为超过Apple成为中国平板电脑市场出货量第一,这是自2010年以来中国平板电脑季度出货量首次出现TOP1 品牌的更替。
先楫新一代的仪表显示产品具有高画质、低功耗等特点
2024年3月4日,上海 - 国产高性能微控制器厂商上海先楫半导体科技有限公司(先楫半导体,HPMicro)在其丰富的高性能微处理器产品组合的基础上,推出新一代数字仪表显示及人机界面系统应用平台——HPM6800系列。
按照华为迭代策略,华为Mate 60系列后的下一款顶级旗舰,便将是全新的华为P70系列,不出意外的话将至少同时推出P70、P70 Pro和P70 Art三款机型,将有望在3月与大家见面,截至目前已经有
3月3日消息,继美国变现裁员之后,博通旗下VMWare又传出上海大裁员。消息人士向ICTIME透露,博通旗下VMWare上海已裁员15%,赔偿N+2。此前,一名自称VMWare员工的“Outrageo
2月28日,珠海专精特新企业高质量发展大会以“扶持‘小巨人’、发展大产业”为主题,在珠海国际会展中心举办,并对34家新认证的国家级专精特新“小巨人”企业代表进行集中授牌。极海微电子股份有限公司(以下简
     2024年2月29日,广州互联网协会第四届理事会第一次会议暨广州市数字经济行业工会联合会第二次委员会在广州大厦顺利召开。广州市委统战部新阶处处长张正学、市工信局数字产业处二级调研员梁海珍、市
业内消息,近日新加坡 RF GaN(射频氮化镓)芯片供应商 Gallium Semiconductor(加联赛半导体)突然终止业务并解雇所有员工,包括位于荷兰奈梅亨的研发中心。加联赛半导体发言人表示:
★欢迎星标 果壳硬科技★脑深部电刺激(DBS)需要通过手术在脑内植入电极,对功能失常的脑网络进行调控,脑网络功能失常表现为各种神经疾病。对丘脑底核(丘脑下方的一个小型结构)的DBS常用于治疗帕金森病,
3月1日,ODM(原始设计制造商)巨头龙旗科技举行首次公开发行股票并于上交所主板上市仪式。至此,国内三大智能产品ODM厂商——华勤技术、龙旗科技、闻泰科技悉数登陆A股。截至当日收盘,龙旗科技股价上涨9
点击上面↑“电动知家”关注,记得加☆“星标”!中国新能源汽车发展史!电动知家消息,3月4日,在新车发布后的首个交易日,理想汽车跌幅一度超过13%。截至收盘,理想汽车港股股价暴跌10.71%,报收160
《APM32芯得》系列内容为用户使用APM32系列产品的经验总结,均转载自21ic论坛极海半导体专区,全文未作任何修改,未经原文作者授权禁止转载。如何提高APM32F103C8T6的ADC外设精度引言
3月1日,知名艺人田亮与叶一茜夫妇在巴拉巴拉首家城市旗舰店--温州五马街店开启了一场别开生面的品牌溯源直播,以边逛边介绍的实景直播形式为消费者展示巴拉巴拉当季新品,最终以单小时最高在线量2.8w+人数