每日一看大模型新闻（2024.1.2-1.3）同花顺：问财大模型内测申请开启；高情商的NPC来了，刚伸出手，它就做好了要配合下一步动作的准备；ChatGPT文明模拟器再上线，一键穿越回火山爆发当天的庞|电子爱好者

admin管理员组
文章数量:1532362

1.产品发布

1.1摩根大通推出多模态文档理解模型DocLLM

发布日期：2024-1-3

摩根大通宣布推出用于多模态文档理解的DocLLM (chinaz)

主要内容：摩根大通发布了DocLLM，一款专为多模态文档理解设计的生成式语言模型，通过轻量级扩展LLM，避免昂贵的图像编码器，以提高文档分析效能。在16个已知数据集中，DocLLM在多种文档智能任务中表现优越，对未见数据集具有强大泛化能力。摩根大通承诺以轻量级方式将视觉融入DocLLM，进一步提升其多模态文档理解能力。

论文地址:https://arxiv/pdf/2401.0090

1.2同花顺：问财大模型内测申请开启

发布日期：2024-1-2

内测申请开启！同花顺问财大模型—HithinkGPT来了！

主要内容：同花顺问财HithinkGPT大模型的内测申请已经开始。投顾对话机器人同花顺问财现在经过成功升级，基于HithinkGPT，成为国内金融领域首个应用大模型技术的智能投顾产品。问财HithinkGPT大模型采用transformer的decoder-only架构，提供7B、13B、30B、70B和130B五种版本选择。此模型最大允许32k文本输入，支持API接口调用、网页嵌入、共建和私有化部署等能力，并为用户提供一站式标注和评测服务。

2.技术更新

2.1高情商的NPC来了，刚伸出手，它就做好了要配合下一步动作的准备

发布日期：2024-1-3

高情商的NPC来了，刚伸出手，它就做好了要配合下一步动作的准备

主要内容：该研究专注于人与虚拟人的互动任务，特别是涉及物体的互动任务，提出了一项名为在线全身动作反应合成的新任务。新任务将基于人类的动作生成虚拟人的反应。为了支持新任务，作者构建了两个数据集，分别命名为 HHI 和 CoChair，并提出了一个统一的方法。具体来说，作者首先构建了社交可供性表示，然后提出了一种社交可供性预测的方案，使虚拟人能够基于预测进行决策。实验证明，该方法可以在两个数据集上有效生成高质量的反应动作，并且能在一块 A100 上实现 25 FPS 的实时推理速度。此外，作者还在现有的人类互动数据集 Interhuman 和 Chi3D 上验证了方法的有效性。

论文地址：https://arxiv/pdf/2312.08983.pdf

项目主页：Interactive Humanoid: Online Full-Body Motion Reaction Synthesis with Social Affordance Canonicalization and Forecasting

2.2 deepin操作系统推出8种AI修图功能

发布日期：2024-1-3

AI 来袭，deepin深度看图让你的照片焕然一新！ – 深度科技社区

主要内容：深度操作系统宣布他们最近推出了一款名为“看图AI插件”的新产品。安装后，用户可以在设备上体验8种AI修图功能，包括图像上色、提升分辨率、模糊背景、删除背景、手绘漫画、2D漫画、3D漫画和素描。这些功能不依赖于互联网在线模型，也不受算力硬件的限制，在个人电脑上可以轻松运行。

2.3维基百科+大模型打败幻觉！斯坦福WikiChat性能碾压GPT-4，准确率高达97.3%

发布日期：2024-1-3

维基百科+大模型打败幻觉！斯坦福WikiChat性能碾压GPT-4，准确率高达97.3%

主要内容：斯坦福大学的研究团队发布了名为WikiChat的聊天机器人，该机器人被称为首个几乎不产生幻觉的聊天机器人。在新的基准测试中，WikiChat获得了97.3%的事实准确性，相比之下，GPT-4的得分仅为66.1%。研究人员还发现了检索增强生成（RAG）的几个缺点，并添加了几个重要步骤，以进一步减轻幻觉，并改进「对话性」指标。通过这些优化，WikiChat在事实性方面比微调后的SOTA RAG模型Atlas高出8.5%，在相关性、信息性、自然性、非重复性和时间正确性方面也大大领先。最后，作者将基于GPT-4的WikiChat提炼成7B参数的LLaMA，这个模型在事实准确性方面仍然能拿到91.1%的高分，并且运行速度提高了6.5倍，能效更好，可以本地部署。

论文地址：https://aclanthology/2023.findings-emnlp.157.pdf

项目代码：GitHub - stanford-oval/WikiChat: WikiChat stops the hallucination of large language models by retrieving data from Wikipedia.

2.4 ChatGPT文明模拟器再上线，一键穿越回火山爆发当天的庞贝古城

发布日期：2024-1-3

ChatGPT文明模拟器再上线，一键穿越回火山爆发当天的庞贝古城-36氪

主要内容：随着GPT-4的功能更新，AI模拟历史已经不再是单纯的文字扮演游戏。多模态人工智能的兴起，使得GPT-4能够解读和创建图像，为历史模拟带来了重大提升。历史教授Benjamin Breen公开了将ChatGPT与历史课教学结合的方法和案例，证明了大语言模型非常擅长根据主要源文本的简短片段生成可信的历史背景和人物。通过使用GPT-4和DALL-E3进行多模态历史模拟，我们可以从不同视角思考历史运作的方式，并让过去成为另一种情形。Benjamin教授使用GPT-4和DALL-E3模拟了维苏威火山喷发当天的古代庞贝古城，生成了一幅充满细腻真实感的图像。通过这种方式，我们可以建立一个反馈循环，让图像生成引擎中提取的历史细节能够实际影响文本模拟的发展方向。

项目地址:https://docs.google/documen

3.商业动态

3.1 IDC钉钉联合发布2024 AIGC应用层十大趋势

发布日期：2024-1-3

重磅！IDC、钉钉联合发布 2024 AIGC 应用层十大趋势

主要内容：钉钉联合国际知名咨询机构IDC发布了首份《2024 AIGC应用层十大趋势白皮书》。随着AIGC技术的发展，智能化应用将呈现爆发式增长。IDC预测，到2024年，全球将涌现出超过5亿个新应用，相当于过去40年间出现的应用总和。根据《白皮书》，2024年AIGC应用的十大趋势关键词涵盖应用层创新、AI Agent、专属模型、超级入口、多模态、AI原生应用、AI工具化和AI普惠化。

3.2原钉钉副总裁创业杀入AI Agent赛道，获亿元融资

发布日期：2024-1-3

原钉钉副总裁创业杀入AI Agent赛道，获亿元融资 | 36氪独家-36氪

主要内容：人工智能公司斑头雁智能科技近日完成近千万美元A轮融资，用于继续深入打造企业级AI Agent（人工智能代理）产品BetterYeah AI。该公司由钉钉创始团队成员、原副总裁张毅创立，另外两位联合创始人也来自原钉钉核心团队。BetterYeah AI客户多为行业TOP企业，已在部分业务场景实现突破，包括销售、客服和营销场景。该公司拥有整套自研RPA等超级自动化工具集和Web Builder低代码平台，可为Agent提供手和脚，在更多场景里使用，并大幅降低开发成本。

本文标签：模型来了下一步模拟器它就

版权声明：本文标题：每日一看大模型新闻（2024.1.2-1.3）同花顺：问财大模型内测申请开启；高情商的NPC来了，刚伸出手，它就做好了要配合下一步动作的准备；ChatGPT文明模拟器再上线，一键穿越回火山爆发当天的庞内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://m.elefans.com/xitong/1726839334a1086606.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

xp系统

电子爱好者 - 最新技术资讯及电子产品介绍！

每日一看大模型新闻（2024.1.2-1.3）同花顺：问财大模型内测申请开启；高情商的NPC来了，刚伸出手，它就做好了要配合下一步动作的准备；ChatGPT文明模拟器再上线，一键穿越回火山爆发当天的庞

1.产品发布

1.1摩根大通推出多模态文档理解模型DocLLM

1.2同花顺：问财大模型内测申请开启

2.技术更新

2.1高情商的NPC来了，刚伸出手，它就做好了要配合下一步动作的准备

2.2 deepin操作系统推出8种AI修图功能

2.3维基百科+大模型打败幻觉！斯坦福WikiChat性能碾压GPT-4，准确率高达97.3%

2.4 ChatGPT文明模拟器再上线，一键穿越回火山爆发当天的庞贝古城

3.商业动态

3.1 IDC钉钉联合发布2024 AIGC应用层十大趋势

3.2原钉钉副总裁创业杀入AI Agent赛道，获亿元融资

更多相关文章

号称世界上第一个开源实时翻译的 App，微软开源GraphRAG：极大增强大模型问答、摘要、推理，以及开源基于ChatGPT的超级文本代码智能体（附代码地址）

大模型时代，程序员如何实现自我成长？——一名普通开发者的 ChatGPT 2周年记

一建部署自己的AI集合平台，无缝切换ChatGPT、Claude、Google Gemini、Mistral、LLaMA2等主流AI大模型

大模型时代，程序员如何实现自我成长？——一名普通开发者的 ChatGPT

复旦团队发布类ChatGPT模型MOSS，服务崩掉后并给出回复

生成模型之VAE与VQ-VAE

MNN+win10模型转换工具编译

amd 安卓虚拟机_一款完美解决AMD兼容问题的安卓模拟器

APUS-xDAN-4.0（MoE）参数规模1360亿，可在消费级显卡4090上运行。国内首个开源千亿参数MoE大模型来了！性能超Grok-1，单张GPU可跑.

【杂谈】当当最新购书优惠来了，满300-60，AI好书推荐

Win7 系统下配置WinCE 5.0 模拟器网络环境

ChatGPT 一统所有 AI 模型入口，四步实现文本分类、图像生成等 24 种复杂任务！...

聊聊当下火热的通用人工智能--ChatGPT引爆的大模型时代

做大模型时代的「Linux」， ChatGPT 仅是开端

最新AI工具（GPT-4o识图大模型、GPT3.54.0、GPTs、AI绘画、文档分析使用教程）

刚刚，OpenAI发布了o1模型，国内可用

清华智谱AI大模型ChatGLM-Pro申请开通详细教程

AI日报：当前最强国产Sora大模型Vidu发布；Kimi Chat移动端升级；通义千问开源首个千亿参数模型；苹果计划与 OpenAI 合作

【干货超全】国内外常见的Ai大模型汇总！！！

ChatLaw：中文法律大模型

发表评论

推荐文章

manjaro 安装搜狗拼音输入法

WiFi无密码连接，微信扫一扫知密码

联想y7000p电池固件下载_联想拯救者Y7000P安装双系统win10+ubuntu18.04

太快了！ChatGPT添加代码注释

AIGC从入门到实战：ChatGPT 简介：从 GPT1 到 GPT4 的发展历程和应用领域

热门文章

selenium-设置chrome浏览器无界面模式

Windows版navicat for mysql 11.2注册码

双系统重装Ubuntu20.04及系统基本配置

Windows 10 子系统Linux重启(不重启Win10)

解决Ubuntu16.04的WPS无法使用搜狗拼音输入法

实体机安装linux系统,实体机安装Ubuntu系统

期末复习题

华硕原厂系统天选5Pro原厂Win11系统恢复安装过程方法

ChatGPT-4o强大的图像识别能力

申请GPT-4插件，等待GPT-4插件候补全过程

最新文章

电脑设置系统还原点

树莓派系统的备份与还原（五）

Ubuntu系统备份、恢复至其他电脑

树莓派安装系统和系统备份还原

计算机操作者权限恢复,win10系统提示“需要管理员权限”的还原方案

便捷式备份系统并还原

计算机环境变量怎么恢复默认,环境变量怎么还原

电脑壁纸设置完之后又变回去了怎么办？解决电脑重启壁纸还原攻略

计算机桌面文件自动备份取消,电脑自动还原功能怎么取消-电脑自动还原功能的取消方法 - 河东软件园...

服务器怎么使用快照还原系统,云服务器创建快照与还原

冰点还原2023中文版最新电脑系统数据恢复软件

飞腾FT-20004处理器下（麒麟系统）Clonezilla再升龙快速备份还原及部署系统（2）--恢复还原

ubuntu系统备份还原到相同电脑、另一台电脑。（tar方式）

win10系统还原被组策略关闭怎么解决

dell服务器vhd系统还原,如何使用 Dell Backup and Recovery 还原戴尔出厂映像

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

ZXMVC8900(V3

【模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313】模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313 官方免费下载

【生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD】生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD 官方免费下载

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载