Brave新世界:LeoAI和Ollama为Brave浏览器用户带来RTX加速的本地LLM

英伟达NVIDIA中国 2025-01-24 17:31


从游戏和内容创作应用,再到软件开发和生产力工具,AI 正越来越多地集成到应用中,以增强用户体验和提高效率。


这些效率提升将延伸到日常任务,如网页浏览。作为一款致力于保护隐私的网络浏览器,Brave 推出了一款名为 Leo AI 的智能 AI 助手,除提供搜索结果之外,该助手还可以帮助用户总结文章和视频,从文档中获取见解,回答问题等。


Leo AI 将帮助用户总结文章和视频,从文档中获取见解,回答问题等。


Brave 和其他 AI 赋能工具背后的技术组合了硬件、软件开发库和生态系统软件,这类软件经过优化,可满足 AI 的独特需求。


为什么软件至关重要


从数据中心到 PC,NVIDIA GPU 构建了世界的 AI。它们包含 Tensor 核心,这些核心经过专门设计,可通过大规模的并行运算来加速 Leo AI 这类 AI 应用—— 快速同步处理 AI 所需的大量运算,而不是逐次运算。


但只有当应用能够高效利用强大的硬件时,这些硬件才有意义。在 GPU 上运行的软件对于提供最快速和最具交互性的 AI 体验同样至关重要。


第一层是 AI 推理库,它充当转换器,用于接收常见的 AI 任务请求,然后将其转换为特定指令以便硬件运行。热门推理库包括 NVIDIA TensorRT、Microsoft 的 DirectML,以及 Brave 和 Leo AI 通过 Ollama 使用的名为 llama.cpp 的推理库。


Llama.cpp 是一个开源软件开发库和框架。CUDA 是 NVIDIA 的软件应用编程接口,可帮助开发者为 GeForce RTX 和 NVIDIA RTX GPU 进行优化,通过 CUDA 可为数百个模型提供 Tensor 核心加速,包括热门的大语言模型(LLM),如 Gemma、Llama 3、Mistral 和 Phi。


除推理库以外,应用通常还使用本地推理服务器来简化集成。推理服务器负责处理下载和配置特定 AI 模型等任务,以便减轻推理库的负担。


Ollama 是一个开放源代码项目,它构建于 llama.cpp 之上,提供对软件开发库功能特性的访问。它支持提供本地 AI 功能的应用生态系统。在整个技术栈中,NVIDIA 致力于优化 Ollama 等工具,以便在 RTX 硬件上提供更快、响应速度更出色的 AI 体验。


Brave Leo AI 等应用可以借助 RTX 驱动的 AI 加速,以增强用户体验。


NVIDIA 对优化的专注涵盖整个技术栈——从硬件到系统软件,再到推理库和工具,以帮助 RTX 上的应用提供更快、响应速度更出色的 AI 体验。


本地与云端对比


Brave 的 Leo AI 可以通过 Ollama 在云端或本地 PC 上运行。


使用本地模型推理具有诸多优势。由于无需向外部服务器发送提示词以进行处理,因此可获得专有且始终可用的体验。例如,Brave 用户可以获得有关财务或医疗问题的帮助,而无需向云端发送任何内容。此外,在本地运行也不需要为无限制的云访问付费。使用 Ollama,用户可以利用比大多数托管服务更广泛的开源模型,后者通常只支持同一 AI 模型的一或两个变体。


用户还可以与专业领域各不相同的模型进行交互,例如双语模型、紧凑型模型、代码生成模型等。


在本地运行 AI 时,RTX 能够提供快速、响应速度较高的体验。使用 Llama 3 8B 模型配合 llama.cpp,用户可体验高达 149 token/s(约等于每秒 110 个单词)的响应速度。将 Brave 与 Leo AI 和 Ollama 搭配使用时,它能更迅速地回复问题、内容摘要等请求。


NVIDIA 内部吞吐量性能测试:在 NVIDIA GeForce RTX GPU 上运行 Llama 3 8B 模型,输入序列长度为 100 个 tokens,输出为 100 个 tokens。


开始使用 Brave 与 Leo AI 和 Ollama


安装 Ollama 非常简单——只需从项目网站下载安装程序,然后在后台运行即可。用户可以通过命令提示符下载并安装一系列受支持的模型,然后从命令行与本地模型进行交互。


有关如何通过 Ollama 添加本地 LLM 支持的简单说明,请参阅该公司博客。配置好 Ollama 之后,Leo AI 将使用本地托管的 LLM 来处理用户请求。用户还可以随时在云端和本地模型之间切换。


Leo AI 在 Ollama 上运行并通过 RTX 加速,使用搭载该助手的 Brave 浏览器可获得更出色的浏览体验。



蛇年将至,NVIDIA 携好运而来!点击下方微博小程序,关注 @NVIDIA英伟达中国 ,转发置顶微博即可参与现金红包抽奖!

评论
  • 案例概况ABB能源自动化公司通过宏集Cogent DataHub软件将电厂设施的数据实时传输到公司办公室,实现了OPC隧道/镜像解决方案,在电厂和公司网络之间建立了一个安全、可靠的连接,确保数据传输的高度安全,减少入侵风险。(一)应用背景1.确保电厂与公司办公室之间的安全数据传输ABB能源自动化公司为发电厂提供软件和控制系统,确保发电厂设备在最佳速度和效率下运行。在近期的项目中,ABB发现若能直接在公司办公室监控电厂的运行情况,将大大提高工作效率。于是ABB项目工程师Michele开始寻找一种可
    宏集科技 2025-02-13 16:38 119浏览
  • 前言最近正好想要做一个定位器,正好可以用嘉立创的STM32F407的板子,还要淘晶驰的串口屏配合NEO-6M做一个GPS实时定位感觉设计到的知识点还是挺全面的,包括串口通信,还要定时器硬件NEO-6M采用串口通信,默认9600(可以通过软件改115200)搭配有源天线,在室外定位很好用淘晶驰很火的串口屏,通过自带的软件可以随便画界面,还是很方便的可通过 USART HMI 软件进行全界面可视化编辑、支持 “C 语言代码” 和 “0 代码” 双模式编程,广泛应用于工业控制、智能家居等领域的智能串口
    小恶魔owo 2025-02-13 23:05 98浏览
  • 在上一期的内容中,我们精心为大家整理了一份关于晶台光耦在各类通信(驱动)电路中应用的选型指南。考虑到不同通信速率下的应用需求存在显著差异,如何准确选择适合的芯片并在同时合理控制成本,成为了设计过程中至关重要的一环。因此,从本期开始,我们将通过一系列详尽的应用实例及其原理示意图,为设计者们提供切实可行且具有高度参考价值的解决方案。晶台光耦的性能优势晶台光耦作为一种高性能的电子组件,在单片机(MCU)与可编程逻辑控制器(PLC)的通信电路中应用广泛。其晶体管输出型光耦系列,能满足多种中高速通信需求,
    晶台光耦 2025-02-13 10:34 146浏览
  • 前言基于 ESP32 设计开发的智能流动环境检测车,旨在克服传统固定监测方式的不足。该车能够在不同环境场景下灵活移动,深入到各个角落进行环境数据采集,大大拓展了环境监测的范围和灵活性。通过集成多种先进的传感器,如 BMP280 用于精确采集温湿度和气压数据,ESP32cam 摄像头能够捕捉直观的图像信息,再结合网络 API 获取的天气预报信息,实现了多源数据的综合采集与分析,为全面、准确地了解环境状况提供了丰富的数据支持。展示整车展示APP展示云端展示功能1.除草(12v割草机)2.环境检测3.
    小恶魔owo 2025-02-13 11:43 261浏览
  • 我跟EET的相识,起源于一次国际电子工程会议,当时我是为了去听国际行业趋势和新技术产品,以公司海外英文名报名参加的,在非常不经意间,我在会场的群里发表了少许观点,没想到当场就有很多人加我微信,微信加得手软,有位VIP席位上的美国有排名的科学家(她当时在上海中科院任职)约了与我共进午餐,隔年这位美国科学家还带来了国际合作,我们公司与亚洲最大的技术顾问公司签了战略合作及一些实际合作项目。所以,我挺早就在EET面包板上了,只不过那些年我所在的公司的国际业务繁忙,还要忙着参加美国分公司的筹备,于是下班后
    牛言喵语 2025-02-14 02:15 82浏览
  • 今日,长虹官宣旗下AI TV正式接入DeepSeek,并支持在“深度思考(满血R1)”和“快速响应”两个版本间自由切换,这意味着行业首个能深度思考的AI TV智能体已全面上线。据长虹相关负责人表示,目前,长虹电视用户终端的升级工作已全部结束,所有搭载了沧海智能体的长虹AI TV均已正式接入DeepSeek。通过深度融合DeepSeek的模型能力,持续升级用户的智能交互体验,真正做到让用户一次购买,就能享受产品的持续进化,让电视始终处于不断发展、永无最终形态的进化进程中。据了解,用户无需复杂的操作
    华尔街科技眼 2025-02-13 12:00 196浏览
  • 文/Leon编辑/cc孙聪颖‍DeepSeek的持续火爆,正在向各个领域蔓延,包括智能终端、汽车智驾、制造业、金融和教育等。其中,DeepSeek在手机领域的应用最为引人关注。《华尔街科技眼》了解到,国产品牌努比亚则将深度整合DeepSeek,采用了系统级内嵌方式,用户在手机亮屏时可以直接与集成DeepSeek大模型的智能体对话,无需跳转应用。此前,华为小艺助手也接入了DeepSeek,但更接近于插件的方式,而非系统级的调用。DeepSeek大模型的优势在于用较低的训练成本实现高性能推理,并且开
    华尔街科技眼 2025-02-12 17:12 215浏览
  • 文心一言免费对于创业来说是一个很大的机遇,加油!虽然是一个很大的挑战,但是好处还是很大的。文心一言的免费开放为创业者提供了一个低成本甚至零成本使用先进人工智能技术的机会。在以往,创业者若想在项目中融入AI技术,往往需要支付高昂的研发或授权费用。而现在,他们可以直接利用文心一言的强大功能,如语言理解、生成能力、深度搜索等,来构建自己的产品或服务,从而显著降低创业成本。文心一言的全面免费开放为创业者提供了广阔的创新空间。创业者可以基于文心一言开发出各种创新的应用和服务,满足市场的多样化需求。例如,利
    curton 2025-02-14 13:37 51浏览
  • 文心一言准备免费,说实话,这个是好事情,但是他也会产生非常大的影响,总体来说,对技术的发展还是起到积极的作用。文心新苑为什么要免费呢?无非就是市场的原因,绝对不是文心一言不想利用这个AI赚钱。我分析下原因:1、市场竞争:在人工智能技术高速发展的背景下,各类AI产品层出不穷,市场竞争日益激烈。尤其是DEEPSEEK的出现,真是的非常重大的一个事件,作为同类产品,文心一言非常无奈的被迫的选择全面免费策略,旨在迅速提高用户量,争夺市场份额。通过免费使用,文心一言能够吸引更多用户,形成网络效应,进而提升
    curton 2025-02-14 10:30 65浏览
  • 文:杜杰编辑:孙聪颖如果说2024年是手机的AI元年,三星应该是第一个站出来表示同意的,毕竟在ChatGPT热热闹闹的同时,三星S24是第一批“吃螃蟹”的。在经过了一年的AI试水之后,今年开年三星就率先在海外发布了进一步重构AI的S25,而今天该系列的国行版正式发布,大家最感兴趣的就是这部搭载原生AI的S25在国内的表现到底如何。无感的AI与去年S24小打小闹不同,今年S25在AI方面堪称是全面化、本地化,而从软硬件整合方面来看,显然AI已经成为S25的灵魂。经过这两年各路AI应用的训练,大家或
    华尔街科技眼 2025-02-13 19:30 130浏览
  • 一、前言随着自动驾驶技术的快速发展,庞大的测试数据和复杂的场景需求为性能与安全评估带来了巨大挑战。如何高效管理海量数据、挖掘关键场景,并满足以Euro NCAP(European New Car Assessment Programme,欧洲新车安全评鉴协会)为代表的严格评估标准,已成为行业亟待解决的核心问题。这不仅关乎技术研发的效率与精度,更是智能驾驶车辆进入市场、提升竞争力的关键前提。本文我们将围绕如何应对海量数据所带来的挑战进行探讨,分享提高场景测试与性能安全评估的见解。二、 场
    康谋 2025-02-13 10:44 129浏览
  • 在电路板Layout设计时,有时候会遇到高速差分信号对间或者对内需要交叉走线的情况,这不仅会导致Layout困难,而且交叉走线导致的via增加和绕线也会影响高速信号的信号质量。鉴于这个问题,一些高速差分信号在标准中就定义了其可以对内或者对间交叉连接,而不影响数据对接。现根据标准定义,将各个高速差分信号是否支持对间或对内翻转列出来,供设计参考。注:1. 列出的高速差分信号不全,后续陆续补充;2. 具体使用时,还需要咨询芯片供应商是否支持。USB2.0不支持对间和对内翻转USB3.0支持对内极性翻转
    durid 2025-02-14 08:23 80浏览
  • ​随着GNSS技术的不断进步,各类设备广泛采用该技术实现高精度定位,并推动了其在众多领域的广泛应用。对于关键行业如汽车制造和基础设施,设备的可用性和可靠性被视为基本准则,GNSS作为提供“绝对位置”信息的关键传感器,其稳定性和可靠性尤为关键。为此,中国已为汽车行业制定了详细的GNSS定位规范和行业标准。GNSS模拟器解决方案支持:BD 420005—2015 《北斗/全球卫星导航系统(GNSS)导航单元性能要求及测试方法》BD 420023—2019 《北斗/全球卫星导航系统(GNSS) RTK
    德思特测试测量 2025-02-13 15:35 137浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦