admin管理员组

文章数量:1576394

大模型日报

2024-05-19

大模型资讯

  1. Meta推出新版AI模型并向公众开放,声称其性能超越免费版ChatGPT

  • 摘要: Meta公司最近发布了其AI聊天机器人的新版本,并将其开放给公众使用。Meta声称,这个新版本的AI模型比OpenAI的免费版ChatGPT更加强大,展现了Meta在人工智能领域的进一步发展和技术实力。
  •  【ps 亲测还是GPT好用~~ 一个GPT升级ChatGPT Plus的小教程】
  • 如果需要升级 Plus,目前国内升级 Plus 最方便快捷的便是,虚拟卡,虚拟卡可以理解为一张充值卡,你把钱充在里面,然后使用它去支付 Plus 费用。

    目前用过最好用的虚拟卡平台是 wildcard,网址:

    https://wildcard/i/GPT0123 (PS: 邀请码记得填上 GPT0123,这样有后续信用卡支付会有 2 美元优惠

    这个平台最方便的是,可以快速一键升级完你的 GPT 账号,之前我在其它虚拟卡平台购买的卡片信息,需要自己去 openai 官网输入卡账号等信息,还会因为 IP 在国内被拒绝支付,所以这个平台的一键升级就解决了这些问题,非常丝滑~

  1. 苹果即将发布的iOS 18搭载AI新功能

  • 摘要: 在iOS 18发布前夕,苹果公司的研究人员发表了一篇论文,详细介绍了他们如何训练即将出现在iOS 18中的AI模型。这次更新预计将充满各种人工智能特性,为用户带来前所未有的智能操作体验。

  1. 富士通被选为GENIAC项目开发逻辑推理的大型语言模型

  • 摘要: 2024年5月17日,富士通公司宣布被选为GENIAC项目的合作伙伴,将启动大型语言模型的开发工作。这些模型专注于逻辑推理能力,旨在推动5G和人工智能技术,特别是在对话式AI和生成式AI领域的进步。该项目的进展将通过行业新闻、市场新闻和技术报告等渠道进行广泛报道。

  1. 推出专为雅可比解码法降低延迟的新型大型语言模型CLLMs

  • 摘要: 新闻报道称,一种新型的大型语言模型家族——一致性大型语言模型(CLLMs)已经推出,专门为雅可比解码方法优化,以减少计算延迟。这些模型加入了包括GPT-4、LLaMA和PaLM在内的大型语言模型阵列,继续推动人工智能技术的发展边界。

  1. 人工智能新发现:机器推理的曙光

  • 摘要: 最新的人工智能研究表明,语言模型在理解和执行抽象概念方面取得了显著进步。这一发现被认为是机器真正推理能力的开始,标志着人工智能领域的一个重要步骤向前迈进。

  1. Google在I/O 2024活动上宣布其最大AI模型Gemini的命名由来

  • 摘要: Google在其I/O 2024活动上宣布了其迄今为止最大的人工智能模型,命名为Gemini。这一名称来源于拉丁文的星座和黄道十二宫之一的双子座,象征着该AI模型的双重特性和智能能力。

  1. 雪花科技拟以逾10亿美元收购Reka AI,扩大其生成式AI业务

  • 摘要: 雪花科技(NYSE:SNOW)宣布将以超过10亿美元的价格收购Reka AI。Reka AI是一家专注于大型语言模型的公司,此举将有助于提升雪花科技在生成式人工智能领域的服务能力和产品范围。

  1. SpeechVerse:多模态AI框架让大型语言模型处理语音任务

  • 摘要: SpeechVerse是一个多模态人工智能框架,它赋予大型语言模型(LLMs)理解自然语言指令并执行各种语音处理任务的能力。尽管LLMs在文本处理和指令理解方面表现出色,但在处理非文本数据,如语音等方面仍存在挑战。SpeechVerse框架旨在弥补这一差距。

  1. Google推出基于Gemma的项目Navrassa,打破印度语言障碍

  • 摘要: Google几个月前推出了一个开源人工智能模型Gemma。这项技术巨头声称,该模型已被社区所接受。现在,Google基于Gemma推出了项目Navrassa,旨在解决印度语言多样性带来的沟通障碍,以促进信息的无障碍交流。

  1. 微软发布开源小型语言模型Phi-3

  • 摘要: 微软于周二对外公开了其最新的小型语言模型Phi-3。这是Phi系列的更新版本,据称能够处理许多之前需要更大模型才能完成的任务。作为开源项目,Phi-3将有助于推动小型模型在各种应用中的发展和创新。

大模型产品

大模型论文

  1. UniRAG:多模态大型语言模型增强

  • 摘要: 本文提出了模型无关的UniRAG技术,通过在推理阶段为多模态大型语言模型(MM-LLMs)的输入提示中添加相关检索信息,显著提升了模型在MSCOCO数据集上的生成质量。

  1. 4D全景场景图生成

  • 摘要: 本文提出4D全景场景图(PSG-4D),一种新的4D环境表示方法。通过PSG4DFormer模型,结合Transformer,实现了对动态4D世界中实体与时序关系的精确预测与追踪,并在新构建的数据集上验证了方法的有效性。

  1. 硬件感知语言模型基准评测

  • 摘要: 提出HW-GPT-Bench,一个考虑硬件约束的语言模型基准。通过共享权重技术训练超网络,跨13种设备评估模型性能,并利用8种NAS算法验证Pareto前沿的有效性。

  1. 基于强化学习优化视觉语言模型决策

  • 摘要: 提出一种算法框架,通过强化学习对大型视觉语言模型进行微调,利用链式推理生成文本动作,以提高多步骤目标导向任务的决策能力。

  1. 时间线句子分解与时态事实提取

  • 摘要: 本文提出了基于时间线的句子分解策略,利用大型语言模型(LLMs)的上下文学习功能,解决复杂句子中时间与事实对应的挑战,并通过TSDRE方法在构建的ComplexTRED数据集上取得了先进成果。

  1. 小型LLMs作为优化器的局限性

  • 摘要: 本文探讨了通过提示策略提升大型语言模型效能的OPRO方法。研究发现,在小型LLMs如LLaMa-2和Mistral 7B上,OPRO效果有限,建议针对这些模型使用直接明确的指令,以提高提示工程的效率和效果。

  1. 大词汇连续手语识别与检索

  • 摘要: 本研究提出了一个多任务Transformer模型CSLR2,用于大词汇量的连续手语识别和检索。通过引入新的数据集注释和优化损失函数,模型在两个任务上均显著超越了先前的最佳性能。

  1. 自动在线文本隐私保护框架

  • 摘要: 本研究提出一种自动文本隐私化框架,通过强化学习微调大型语言模型,平衡文本的合理性、可理解性与隐私性。在英文Reddit帖子的大规模测试集上进行评估,有效抵御了多种自动化作者识别攻击。

  1. 3D世界中的大型语言模型综述

  • 摘要: 本文综述了大型语言模型(LLMs)处理、理解及生成三维数据的方法。涵盖了从点云到神经辐射场(NeRFs)的多种三维数据表示,探讨了其在场景理解、问答及导航等任务中的应用,并指出了未来研究方向。

大模型开源项目

  1. ChatGPT桌面应用项目

  • 摘要: lencx是一个开源项目,提供了一个用Rust语言编写的ChatGPT桌面应用,支持Mac、Windows和Linux系统。项目旨在为用户提供便捷的本地聊天机器人体验。

  1. mendableai:网站转换为LLM适用Markdown

  • 摘要: mendableai是一个用TypeScript编写的开源项目,其功能是将整个网站内容快速转换成适用于大型语言模型(LLM)的Markdown格式,以便于进行进一步的数据处理和分析。

  1. 多平台支持的AI聊天机器人

  • 摘要: zhayujie是一个基于大模型的聊天机器人项目,支持多种平台和接入方式。能够处理文本、语音、图片,实现自定义智能客服。

  1. ngc660sec:多功能微信机器人

  • 摘要: ngc660sec是一个基于HOOK机制的微信机器人,能够推送安全新闻、查询WHOIS信息、星座、天气等,并支持摸鱼日历、威胁情报查询等多种实用功能,易于上手,使用Python编写。

  1. Azure-Samples:Azure AI聊天体验加速器

  • 摘要: Azure-Samples项目提供了一个在Azure上运行的RAG模式解决方案加速器。它结合Azure AI Search和Azure OpenAI的大型语言模型,为用户打造类似ChatGPT的交互和问答体验,包含常见需求与最佳实践,使用Python语言编写。

  1. VILA:多图像视觉语言模型

  • 摘要: VILA是一个高效的大型视觉语言模型,支持训练、推理和评估。该模型可部署于云端和边缘设备,如Jetson Orin和笔记本电脑,使用Python语言编写。

  1. Doriandarko:智能子代理框架

  • 摘要: Doriandarko是一个使用Python编写的框架,旨在为Claude Opus提供智能化的子代理协调机制,以优化任务执行流程。

  1. 微信机器人逆向项目:lich0821

  • 摘要: lich0821是一个用C++编写的Github热门AI项目,实现了微信逆向和机器人功能。它能够与ChatGPT等多个大型AI模型对接,为用户提供强大的微信自动化交互能力。

本文标签: 模型日报