点击蓝字 关注我们
SUBSCRIBE to US
STK043_VRG_Illo_N_Barclay_2_Meta
Meta公司宣布推出了最新的人工智能模型系列 —— Llama 4,该系列模型目前已应用于网页端以及WhatsApp、Messenger和Instagram上的Meta AI助手(https://ai.meta.com/blog/llama-4-multimodal-intelligence/)。这两款新模型也可以从Meta公司官网或Hugging Face平台上下载,它们分别是Llama 4 Scout—— 一款小模型,能够 “在单个英伟达H100 GPU中运行”;以及Llama 4 Maverick,它更类似于GPT-4o和Gemini 2.0 Flash。Meta 公司表示,目前仍在对Llama 4 Behemoth进行训练,Meta首席执行官Mark Zuckerberg称其为 “世界上性能最高的基础模型”。
据Meta公司称,Llama 4 Scout拥有1000万标记的上下文窗口(即人工智能模型的工作记忆),在 “广泛报道的一系列基准测试中”,其表现超过了谷歌的Gemma 3和Gemini 2.0 Flash-Lite模型,以及开源模型Mistral 3.1,同时仍然 “能够在单个英伟达H100 GPU中运行”。对于更大的Llama 4 Maverick模型,与OpenAI的GPT-4o和谷歌的Gemini 2.0 Flash 相比,Meta公司也做出了类似的性能宣称,并且表示,在编码和推理任务方面,Llama 4 Maverick模型的结果可与DeepSeek-V3相媲美,但其使用的激活参数不到DeepSeek-V3的一半。
Image: Meta
与此同时,Llama 4 Behemoth拥有2880亿个激活参数,参数总数达2万亿个。虽然它尚未发布,但Meta公司表示,Behemoth在 “多项科学、技术、工程和数学(STEM)基准测试中” 的表现能够超越其竞争对手(在这种情况下指GPT-4.5和Claude Sonnet 3.7)。
Meta公司称,对于Llama 4,他们采用了“MoE(mixture of experts)”架构,这种方法通过仅使用特定任务所需的模型部分来节省资源。该公司计划在4月29日举行的LlamaCon会议上讨论其人工智能模型和产品的未来规划。
与过去的模型一样,Meta将Llama 4系列称为 “开源”,尽管Llama因其许可证限制而受到批评。例如,Llama 4的许可证要求月活跃用户超过7亿的商业实体在使用其模型之前必须向Meta申请许可。开源倡议组织在2023年曾指出,这一点使其 “不属于‘开源’类别”(https://opensource.org/blog/metas-llama-2-license-is-not-open-source)。
微信号|IEEE电气电子工程师学会
新浪微博|IEEE中国
Bilibili | IEEE中国
· IEEE电气电子工程师学会 ·
往
期
推
荐
AI如何解读人类幸福?
无人机助推产业迈向新高度
数字干扰让人抓狂?这些方法或许能解决
检查大坝:卫星和无人机如何帮助避免灾难