谷歌推出其人工智能模型Gemini迎合AI商业化的压力
公司和企业可以使用 Gemini 进行更先进的客户服务互动,如聊天机器人和产品推荐,以及识别公司想要宣传产品的趋势。Gemini 还可以用于内容创作,如果公司想要创建营销活动或博客内容,以及希望总结会议或为开发者生成代码的生产力应用程序。
该公司给出的例子包括让 Gemini 获取图表的截图,并分析数百页研究,然后更新该图表。另一个例子是分析一个人的数学家庭作业照片,并识别正确答案和指出错误答案。
Gemini Ultra 是首个在 MMLU(大规模多任务语言理解)上胜过人类专家的模型,MMLU 使用 57 个科目的组合,如数学、物理、历史、法律、医学和伦理,测试世界知识和解决问题的能力。据该公司在周三的博客文章中表示,它能够理解复杂主题中的细微差别和推理。
「Gemini 是谷歌团队间大规模合作努力的结果,包括我们在谷歌研究的同事,」皮查伊在周三的博客文章中写道。「它从头开始构建,是多模态的,这意味着它可以泛化,并无缝理解、操作和结合不同类型的信息,包括文本、代码、音频、图像和视频。」
从今天开始,谷歌的聊天机器人 Bard 将使用 Gemini Pro 来帮助进行高级推理、计划、理解和其他能力。明年初,它将推出使用 Gemini Ultra 的「Bard Advanced」,这将是 Bard 更新的最大一次,它类似于 OpenAI 的 ChatGPT 聊天机器人。
然而,据谷歌周三发布的一份白皮书显示,Gemini 的 Ultra 模型在一些基准测试中超过了 GPT-4。
当被问及谷歌是否计划对「Bard Advanced」的访问收费时,谷歌 Bard 的总经理 Sissie Hsiao 表示,公司专注于创造良好的体验,目前还没有任何盈利细节。
在新闻发布会上,当被问及 Gemini 与当前一代 LLM 相比是否有任何新颖功能时,谷歌 DeepMind 的产品副总裁 Eli Collins 回答说:「我怀疑它确实有」,但他们仍在努力了解 Gemini Ultra 的新颖功能。
据报道,谷歌推迟了 Gemini 的发布,因为它还没准备好,这让人回想起该公司年初推出其 AI 工具时的混乱局面。
多名记者询问了关于延迟的问题,对此 Collins 回答说,测试更先进的模型需要更长的时间。Collins 表示,Gemini 是该公司构建的经过最严格测试的 AI 模型,并且是谷歌任何模型中「最全面的安全评估」。
Collins 说,尽管 Gemini Ultra 是其最大的模型,但提供服务的成本显着降低。他说:「它不仅能力更强,而且更高效。我们仍然需要大量计算来训练 Gemini,但我们在训练这些模型方面变得更加高效。」
Collins 表示,该公司将在周三发布一份关于该模型的技术白皮书,但他表示不会公布参数数量。今年早些时候,CNBC 发现谷歌的 PaLM 2 大型语言模型,当时的最新AI 模型,其训练用的文本数据量是前一代 LLM 的近五倍。
同样在周三,谷歌还推出了其下一代用于训练 AI 模型的张量处理单元。Salesforce 和初创公司 Lightricks 已开始使用的 TPU v5p 芯片,其性能价格比优于 2021 年宣布的 TPU v4,但谷歌没有提供与市场领导者Nvidia 相比的性能信息。
在 10 月的谷歌第三季度财报电话会议上,投资者向高管们提出了更多关于谷歌如何将 AI 转化为实际利润的问题。
今年 8 月,谷歌推出了一个名为「搜索生成体验」(SGE)的「早期实验」,该实验让用户看到在使用搜索引擎时生成式 AI 体验是什么样的——搜索仍然是该公司的主要盈利中心。其结果更具对话性,反映了聊天机器人时代的特点。然而,它仍被视为实验,并尚未向公众推出。
自从 5 月公司在其年度开发者大会 Google I/O 上首次宣布该实验以来,投资者一直在询问 SGE 的时间表。Gemini 周三的公告几乎没有提及 SGE,高管们对其向公众推出的计划含糊其辞,称 Gemini 将「在明年」并入其中。
皮查伊在周三的博客文章中表示:「这个模型驱动的新时代代表了我们作为一家公司所做出的最大的科学和工程努力之一。」「我对未来以及 Gemini 将为世界各地的人们带来的机会感到由衷的兴奋。」
11.11云上盛惠!海量产品 · 轻松上云!云服务器首年1.8折起,买1年送3个月!超值优惠,性能稳定,让您的云端之旅更加畅享。快来腾讯云选购吧!
OpenAI曾于2021年夏天宣布解散其机器人团队,原因是缺乏足够的数据来训练机器人使用人工智能进行移动和推理。但三位来自OpenAI的早期研究科学家创立的初创公司Covariant,声称已经解决了这一难题。这不仅为工业自动化带来了新的可能性,也为未来机器人技术的发展指明了方向。
GoogleDeepMind发布了一份长达150页的技术报告,详细介绍了Gemini1.5Pro和Gemini1.5Flash两个模型的性能特点和架构以及这个多模态大型模型的最新进展。Gemini1.5于今年2月上线,通过工程优化、MoE架构等策略显着提升了性能和速度。Gemini1.5的技术报告展示了谷歌在大型多模态模型领域的最新进展,其性能的提升和应用潜力为未来的AI技术发展提供了新的方向。
在今天凌晨举行的I/O开发者大会上,谷歌表示即将推出Android15,并且还剧透了一些新功能。会上谷歌宣布,为安卓系统引入AI诈骗电话检测功能,在通话中提醒可能存在的诈骗行为,并鼓励用户结束此类通话。目前还不知道这项诈骗检测功能将于何时推出,但谷歌表示该功能默认禁用状态,需要用户手动启用才能生效,这应该是在等Android15系统。
Google即将向学校提供GeminiAI,并专门针对教育工作者和年满18岁的学生提供服务,承诺会将他们的数据用于AI模型训练或与他人分享。Google将在WorkspaceforEducation账户上提供额外的Gemini隐私保护,无需额外付费。这个计划将为教育工作者和学生提供更安全和私的学习环境,同时Chromebooks的无障碍功能也将为视力障碍或低视力的人士提供更好的使用体验。
谷歌在其I/O大会上大肆宣传其Gemini接管搜索,但其中一个最引人注目的演示再次暴露了迄今为止所有大型语言模的一个致命缺陷:自信满满地给出错误答案。在“Gemini时代的搜索”展示片段中,谷演示了视频搜索功能,允许你通过对视频剪辑说话进行搜索。)这已经是谷歌第二次展示自家AI给出错误答案的炫酷展示素材了——去年,Bard聊天机器人自信满满地谎称詹姆斯韦伯太空望远镜是第一个拍摄到太阳系外行星的望远镜。
谷歌在其2024年GoogleI/O大会上宣布,Gmail将获得一次AI升级。根据谷歌的介绍,Gmail用户能够利用其GeminiAI技术搜索、总结和起草邮件。Gemini1.5Pro将作为一个可选升级在WorkspaceLabs中提供,供那些想要尝试其的用户使用。
谷歌在I/O大会上宣布,Android15已融入谷歌Gemini大模型,支持诸如AI语音助理防诈骗、画圈图片搜索、理解图片给出更符合用户需求的答案等功能,Android15Beta2将在明天正式推出。全新升级后的谷歌Gemini已经展现出较强的理解、推理、创作和实时互动能力,实现了对OpenAI多模态模型的全面超越。并且Android15支持短信和彩信应用以及预加载的RCS应用,以便使用卫星通信连接收发信息。
Opera浏览器近日宣布将Google的GeminiAI模型整合到其现有的AriaAI扩展中,为用户提供更多最新信息和更多对话响应。Aria是Opera去年发布的AI助手,可以回答用户查询、编写代码和执行其他任务。Opera浏览器与Google的GeminiAI模型的集成使得用户可以通过Aria获得更多最新信息,并以对话方式与AI助手交流,为用户提供更加便捷和智能的浏览体验。
谷歌计划将其GeminiAI技术直接嵌入到Chrome浏览器的桌面中。在谷歌于本周二举行的I/O大会上,宣布Chrome126版本将采用GeminiNano来为浏器内的AI功能提供支持,包括文本生成等功能。与Edge浏器的Copilot相比,GeminiNano在本地设备上运行,提供更快速和隐私保护的AI体验。
NotezAI是一款智能笔记助手应用程序,它通过先进的语音转文字技术,帮助用户快速准确地记录会议、讲座或个人想法。它具备智能摘要功能,能够迅速为用户提供笔记的要点,同时拥有易于使用的笔记组织功能,帮助用户保持笔记的整洁和易于查找。产品背景信息显示,NotezAI已经帮助成千上万的用户提升了他们的笔记效率,并且通过用户评价可以看出,它在准确性、效率和组织性方面都得到了高度认可。产品提供简单且经济的订阅计划,包括月度和年度订阅选项,并提供7天免费试用。
Travel Echo是一款AI驱动的翻译应用程序,专为旅行者设计,能够将对线多种语言,帮助用户在不同语言环境中进行有效沟通。它通过先进的AI技术提供准确的翻译,支持音频播放和音标转录,帮助用户自信地与当地人交流。
Latercut是一个专注于短视频制作的在线平台,支持快速剪辑和发布到各大社交媒体平台。它利用AI模板技术,简化视频编辑流程,帮助用户节省时间,提高内容创作效率。
Mamouth是一个集成了多种先进AI模型和图像生成服务的平台,旨在帮助用户保持在人工智能技术的前沿。平台提供包括GPT-4o、Claude、Llama、Mistral、Gemini等在内的AI语言模型,以及Dall-E、Midjourney和Stable Diffusion等图像生成工具。Mamouth通过订阅服务模式,为用户提供高效、便捷的AI使用体验,同时支持团队管理和工作空间功能,满足不同用户的需求。
fydback是一个专注于提供自动化绩效反馈的在线平台,旨在帮助团队成员提升工作表现。它使用人工智能技术,根据用户输入的评分和信息,生成定制化的反馈报告。产品的主要优点包括详细的评分系统、多语言支持、以及简单直观的价格结构。背景信息显示,该平台致力于通过AI技术简化反馈流程,促进团队成员的成长和进步。
IntrvuAI是一个在线平台,使用人工智能技术帮助用户准备技术面试。它提供了模拟面试、个性化反馈和简历评估服务,帮助用户提高面试技巧,增强自信心,并确保他们的简历能够吸引潜在雇主的注意。
ZapCardz是一款AI驱动的学习卡片应用,旨在通过智能技术帮助用户更高效地学习。它通过AI生成个性化的学习卡片,支持用户学习新语言,无需手动创建卡片,同时提供手动创建和修改功能。应用界面友好,支持用户在移动中随时更新和个性化卡片,并通过互动学习方式提高学习动力。
Tyms是一款面向雄心勃勃企业的现代会计ERP软件,通过自动化、准确性和灵活性,帮助企业更高效地完成财务操作,快速且智能地完成账目结算。Tyms支持多币种和多实体管理,提供实时的财务分析和报告,以及AI驱动的洞察力,帮助企业做出更明智的财务决策。
RubricPro是一个利用人工智能技术帮助教师和学生进行评分和反馈的平台。它允许用户上传自己的评分标准(rubrics),然后批量评分学生的作业、论文等,并下载评分总结。RubricPro的AI评分系统经过专业测试,与人工评分效果相当,同时注重用户隐私,评分完成后立即删除文档,只保存用户选择保存的评分标准。此外,它还提供了企业定制计划,满足不同规模公司的需求。
Peek是一个浏览器插件,利用人工智能技术帮助用户自动整理和总结浏览器中的标签页。它通过自动分组和内容摘要,帮助用户在浏览网页时保持工作流程,提高效率。Peek能够提取难以记忆的细节,如日期、价格和名称,并且可以快速地重新排序、合并和嵌套主题和任务。此外,用户还可以添加笔记到标签页组中,使想法和标签页作为一个单元移动。Peek的目标是帮助用户在互联网上探索而不迷失方向。
BodyMax AI是一款利用人工智能技术,通过分析用户上传的正面和背面无衣照片,来评估肌肉群并提供详细评分和定制化健身建议的应用。它适用于初学者和健身老手,旨在帮助用户达到更好的身体形态。该应用强调个人隐私,照片仅存储在用户设备上,并不提供医疗建议,所有建议应视为参考。
Replyio是一款AI通信助手,旨在通过智能化的回复和邮件摘要生成,提升用户在Gmail、Outlook、LinkedIn和Twitter上的沟通效率。它支持多语言,确保全球用户都能使用。Replyio提供数据安全保障,并且不采用基于信用的系统,提供无限使用权限。
OpinioAI是一个利用大型语言模型的AI市场研究平台,它可以帮助企业通过AI生成的合成样本来获取客户洞察,无需进行成本高昂的调查或访谈。该平台可以分析现有数据,合成新的洞见,并评估现有内容,以从目标受众的角度获取反馈。OpinioAI旨在帮助公司以更快、更简单、更经济的方式替代传统的数据收集和分析方法。
sherpa-onnx 是一个基于下一代 Kaldi 的语音识别和语音合成项目,使用onnxruntime进行推理,支持多种语音相关功能,包括语音转文字(ASR)、文字转语音(TTS)、说话人识别、说话人验证、语言识别、关键词检测等。它支持多种平台和操作系统,包括嵌入式系统、Android、iOS、Raspberry Pi、RISC-V、服务器等。
DocSolver是一个利用GPT-4 API技术构建的聊天机器人,专为处理和分析大型PDF文件设计。它能够通过自然语言处理技术,理解和回应用户关于PDF文件内容的查询,提供高效的信息检索和文档管理解决方案。
YouTube AI Extension是一个Chrome浏览器插件,允许用户直接与YouTube视频进行实时聊天,提供独特的交互体验。它支持多语言和上下文感知的响应,用户可以通过它获取视频摘要、提问并接收详细解释。
Aurora 是由微软研究院开发的大规模基础模型,它利用超过百万小时的多样化天气和气候数据进行训练。Aurora 利用基础模型方法的优势,为各种大气预测问题提供操作性预测,包括那些训练数据有限、变量异质性和极端事件的问题。Aurora 能在不到一分钟内生成5天的全球空气污染预测和10天的高分辨率天气预报,性能超越了最先进的传统模拟工具和最好的专业深度学习模型。这些结果表明,基础模型可以改变环境预测。
simple-one-api是一个适配多种大模型接口的程序,支持OpenAI接口,允许用户通过统一的API格式调用不同的大模型服务,简化了不同平台接口差异带来的复杂性。它支持包括千帆大模型平台、讯飞星火大模型、腾讯混元大模型等在内的多个平台,并且提供了一键部署和开箱即用的便利性。
ainave是一个专注于人工智能领域的社区平台,提供讨论、工具、文章、问答和职业发展等多元化内容。该平台旨在帮助用户提升AI技能,分享知识,获取灵感,并发现AI领域的突破性想法。目前处于BETA测试阶段,不断优化和更新。
Sleepytales是一个利用人工智能技术为儿童创造个性化睡前故事的网站。它可以根据孩子的姓名、喜爱的角色和主题快速生成引人入胜的故事,并由AI朗读。这项技术不仅丰富了孩子们的想象力,也为他们提供了一个美好的睡前体验。