开源翻译大模型|电子爱好者

admin管理员组
文章数量:1532047

开源翻译大模型

1 简介

在开发过程中，会遇到定制化翻译工具的需要，开源的翻译模型可以解决相应的问题。其中英语转中文的比较好的开源项目有：

序号	组织	模型	地址	备注
1	赫尔辛基大学语言技术研究小组（Language Technology Research Group at the University of Helsinki）	opus-mt-en-zh	英文翻译为中文： https://hf-mirror/Helsinki-NLP/opus-mt-en-zh	支持英文转中文；其他翻译模型在该项目下查找即可。
2	facebook（Meta）	nllb-200	https://hf-mirror/facebook/nllb-200-3.3B	nllb-200可以在200种语言之间进行单句翻译。它有多个参数的模型，推荐使用3.3B，其中600M翻译时会出现“预载载载载载载载载载载”的错误
3	facebook（Meta）	mbart-large-50	英语翻译为其他语言： https://hf-mirror/facebook/mbart-large-50-one-to-many-mmt 多语言翻译为多语言： https://hf-mirror/facebook/mbart-large-50-many-to-many-mmt	mbart-large-50支持将50种语言翻译为其他多语言。
4	facebook（Meta）	SeamlessM4T	在线使用： https://hf-mirror/spaces/facebook/seamless-m4t-v2-large 仓库地址： https://hf-mirror/facebook/seamless-m4t-v2-large	Seamless M4T是一个一体化大规模多语言和多模式机器j基座翻译模型，提供近100种语言的语音和文本高质量翻译。可支持： 1.语音到语音翻译（S2ST） 2.语音到文本翻译（S2TT） 3.文本到语音翻译（T2ST） 4.文本到文本翻译（T2TT） 5.自动语音识别（ASR）

2 下载模型

下载模型的网站

# 国内代理huggingface的网站
https://hf-mirror/

# 下载大模型的网站
https://aifasthub/

下载命令

# 安装huggingface_hub，会在相应的环境中生成huggingface-cli
pip install -U huggingface_hub -i https://pypi.tuna.tsinghua.edu/simple

# 进入到相应的目录下后，下载模型
huggingface-cli download --resume-download facebook/mbart-large-50-one-to-many-mmt --local-dir mbart-large-50-one-to-many-mmt  --local-dir-use-symlinks False

3 项目实例

3.1 模型nllb-200-3.3

源代码

from transformers import AutoTokenizer, AutoModelForSeq2SeqLM, pipeline

# 加载模型
model = AutoModelForSeq2SeqLM.from_pretrained("D:/model/nllb-200-3.3B")
tokenizer = AutoTokenizer.from_pretrained("D:/model/nllb-200-3.3B")

# pipelines使用方法： https://hf-mirror/docs/transformers/main_classes/pipelines
# 翻译语言的地址：https://hf-mirror/facebook/nllb-200-3.3B/blob/main/README.md
# task：任务类型，translation表示翻译
# src_lang： 输入文本的语言，eng_Latn表示英文
# tgt_lang： 输出文本的语言，zho_Hans表示中文
# max_length： 输入文本最大长度；
translator = pipeline(
    task='translation',
    model=model,
    tokenizer=tokenizer,
    src_lang='eng_Latn',
    tgt_lang='zho_Hans',
    max_length=512
)

# 文本
text_en = "Heart disease is a serious threat to human health. "
text_zh = translator(text_en)
print(text_zh)

3.2 模型mbart-large-50-one-to-many-mmt

安装依赖

# 安装sentencepiece 
pip install sentencepiece -i https://pypi.tuna.tsinghua.edu/simple

# 安装protobuf
pip install protobuf -i https://pypi.tuna.tsinghua.edu/simple

源代码

from transformers import MBartForConditionalGeneration, MBart50TokenizerFast

# 加载模型
model = MBartForConditionalGeneration.from_pretrained(
    pretrained_model_name_or_path="D:/model/mbart-large-50-one-to-many-mmt"
)
tokenizer = MBart50TokenizerFast.from_pretrained(
    pretrained_model_name_or_path="D:/model/mbart-large-50-one-to-many-mmt",
    src_lang="en_XX"
)

# 序列化
text_en = "Heart disease is a serious threat to human health. "
model_inputs = tokenizer(text_en, return_tensors="pt")

# 将英语翻译成中文
generated_tokens = model.generate(
    **model_inputs,
    forced_bos_token_id=tokenizer.lang_code_to_id["zh_CN"]
)

text_zh = tokenizer.batch_decode(generated_tokens, skip_special_tokens=True)
print(text_zh)

结果

3.3 模型opus-mt-en-zh

源代码

from transformers import AutoTokenizer, AutoModelForSeq2SeqLM
from transformers import pipeline

# 加载模型
model = AutoModelForSeq2SeqLM.from_pretrained("D:/model/opus-mt-en-zh")
tokenizer = AutoTokenizer.from_pretrained("D:/model/opus-mt-en-zh")

# 创建 pipeline
translator = pipeline(task="translation", model=model, tokenizer=tokenizer)

text_en = "Heart disease is a serious threat to human health. "
text_zh = translator(text_en)
print(text_zh)

结果

3.4 模型SeamlessM4T

由于SeamlessM4T模型太大，此处借助HuggingFace上的模型运行。

本文标签：开源模型

版权声明：本文标题：开源翻译大模型内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://m.elefans.com/xitong/1725599107a1032234.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

xp系统

大模型时代，程序员如何实现自我成长？——一名普通开发者的 ChatGPT 2周年记

1天前

初次接触 ChatGPT 2022 年 11 月 30 日，OpenAI 正式发布 ChatGPT，在短短2年时间里，ChatGPT 不仅成为了生成式 AI 领域的热门话题

chatgpt最强平替国内可用免费开源llama2模型下载使用

1天前

1，github下载llama2项目打开下面的项目地址： GitHub - facebookresearchllama: Inference code for LLaMA models 下载项目代码: GitHub - face

刷榜GitHub！中科院学术科研专用版 ChatGPT开源了！斩获24K star。。论文润色、语法检查，一键搞定！...

1天前

大家好！我是GG哥！ 最近，一位开发者在GitHub上开源的「科研工作专用ChatGPT」项目大受好评。论文润色、语法检查、中英互译、代码解释等等一键搞定。这个项目就是「中科

一建部署自己的AI集合平台，无缝切换ChatGPT、Claude、Google Gemini、Mistral、LLaMA2等主流AI大模型

1天前

一款免费开源的项目即可搞定：ChatGPT、Claude、Google Gemini、Mistral、LLaMA2等主流AI大模型的无缝切换使用！ Lobe UI 是一个开源 UI 组件库&am

“本草”大模型开源，ChatGPT时代，连AI私人医生都出现了？

1天前

大家好，我是千与千寻，也可以叫我千寻，今天给大家分享的ChatGPT新应用项目，是ChatGPT模型在医学领域的应用，什么，医学领域？是的，没错，是医学领域的ChatGPT应用，我们都知道ChatGPT是OpenAI开源的一个智能对话式

推荐一款开源项目：Commitment

1天前

推荐一款开源项目：Commitment commitmentA commit message generator that I use.项目地址:https:gitcodegh_mirrorscocommit

半诚实模型与恶意模型

1天前

原创洪澄开放隐私计算开放隐私计算开放隐私计算OpenMPC是国内第一个且影响力最大的隐私计算开放社区。社区秉承开放共享的精神，专注于隐私计算行业的研究与布道。社区致力于隐私计算技术的传播，愿成为中国 “隐私计算最后一公里的服务区”

matlab amd gpu,没有N卡？那就用AMD GPU训练深度学习模型

19小时前

PlaidML是一种高级且可移植的张量编译器，用于在笔记本电脑，嵌入式设备或其他设备上进行深度学习，而这些笔记本计算机，嵌入式设备或其他设备未充分支持可用的计算硬件，比如Nvidia显卡。 PlaidML位于常见的机器学习框架之下，使用户能

宝妈的需求“一仔播放器” WPF 的开源项目（一项目背景）

15小时前

人生感慨从事互联网软件开发多年，平时没少逛技术平台，自己却没怎么分享过相关的技术，转而就加入了奶爸的行列（成天围着孩子转）&am

APUS-xDAN-4.0（MoE）参数规模1360亿，可在消费级显卡4090上运行。国内首个开源千亿参数MoE大模型来了！性能超Grok-1，单张GPU可跑.

15小时前

国内首个开源千亿参数MoE大模型来了！性能超Grok-1，单张GPU可跑原创程茜智东西 2024-04-02 19:21 北京 APUS-xDAN-4.0（MoE&a

羊驼2:开放的基础和微调聊天模型--Llama 2论文阅读

15小时前

论文地址：https:arxivpdf2307.09288.pdfd 代码地址：GitHub - facebookresearchllama-recipes: Examples and recipes for Llama 2 m

揭秘英伟达A100、A800、H100、H800 GPU如何实现高性能大模型的百倍训练加速

15小时前

关键词：Transformer；PLM；SLM；NLM；LLM；Galactica；O

linux小米随身wifi密码,【L】小米随身WiFi，Linux下AP热点驱动（开源）

8小时前

前言这是作者修改后的Linux下的小米随身WiFi驱动，支持Ap模式，开源，同时支持360随身WiFi二代和小度WiFiQQ群(随身WiFi_Linux_Ap)3896150

【开源电机驱动】使用电气等效对机械系统建模

3小时前

原文地址：http:www.modularcircuitsblogarticlesbridge-to-the-far-sidemodeling-mechanical-systems 本文为译者翻译校正稿

国内的几款强大的智能—AI语言模型

34分钟前

1、国内百度研发的，文心一言： https:yiyan.baiduwelcome 大家如果像我的界面一样有【开始体验】就是可以使用的，否则就是说明在等待中&#

聊聊当下火热的通用人工智能--ChatGPT引爆的大模型时代

25分钟前

前言 ChatGPT目前人工智能领域实在是IT界火热的名字，使IT、互联网又火热了一把，与以往不同，这次着实让模型、算法、AI、大模型、超大规模训练、千亿级参数等不绝于耳。

LLM大语言模型(典型ChatGPT)入门指南

25分钟前

文章目录一、基础概念学习篇1.1 langchain视频学习笔记1.2 Finetune LLM视频学习笔记二、实践篇2.1 预先下载模型：2.2 LangChain2.3 Colab demo2.3 text-g

【ChatGPT 等国内大模型人工智能访问链接汇总】

13分钟前

国内大模型人工智能访问链接汇总 1. 文心一言2. 通义千问3. 讯飞星火4. DeepSeek5. KiMi Chat6. Vega AI最后补一个大模型名单及方向 1. 文心一言文心一言是百度公司推出的一款预训练语言模型。它基于百

每日一看大模型新闻（2024.1.2-1.3）同花顺：问财大模型内测申请开启；高情商的NPC来了，刚伸出手，它就做好了要配合下一步动作的准备；ChatGPT文明模拟器再上线，一键穿越回火山爆发当天的庞

4分钟前

1.产品发布 1.1摩根大通推出多模态文档理解模型DocLLM 发布日期：2024-1-3 摩根大通宣布推出用于多模态文档理解的DocLLM (chinaz) 主要内容：摩根大通发布了Do

刚刚，OpenAI发布了o1模型，国内可用

3分钟前

报！就在刚刚，OpenAI发布了全新的o1系列推理模型及其简化版o1-mini。这个系列专注于解决复杂问题，首发为预览版。o1系列在科学、编程和数学等领域表现出色&#

电子爱好者 - 最新技术资讯及电子产品介绍！

开源翻译大模型

开源翻译大模型

1 简介

2 下载模型

3 项目实例

3.1 模型nllb-200-3.3

3.2 模型mbart-large-50-one-to-many-mmt

3.3 模型opus-mt-en-zh

3.4 模型SeamlessM4T

更多相关文章

大模型时代，程序员如何实现自我成长？——一名普通开发者的 ChatGPT 2周年记

chatgpt最强平替国内可用免费开源llama2模型下载使用

刷榜GitHub！中科院学术科研专用版 ChatGPT开源了！斩获24K star。。论文润色、语法检查，一键搞定！...

一建部署自己的AI集合平台，无缝切换ChatGPT、Claude、Google Gemini、Mistral、LLaMA2等主流AI大模型

“本草”大模型开源，ChatGPT时代，连AI私人医生都出现了？

推荐一款开源项目：Commitment

半诚实模型与恶意模型

matlab amd gpu,没有N卡？那就用AMD GPU训练深度学习模型

宝妈的需求“一仔播放器” WPF 的开源项目（一 项目背景）

APUS-xDAN-4.0（MoE）参数规模1360亿，可在消费级显卡4090上运行。国内首个开源千亿参数MoE大模型来了！性能超Grok-1，单张GPU可跑.

羊驼2:开放的基础和微调聊天模型--Llama 2论文阅读

揭秘英伟达A100、A800、H100、H800 GPU如何实现高性能大模型的百倍训练加速

linux小米随身wifi密码,【L】小米随身WiFi，Linux下AP热点驱动（开源）

【开源电机驱动】使用电气等效对机械系统建模

国内的几款强大的智能—AI语言模型

聊聊当下火热的通用人工智能--ChatGPT引爆的大模型时代

LLM大语言模型(典型ChatGPT)入门指南

【ChatGPT 等国内大模型人工智能访问链接汇总】

每日一看大模型新闻（2024.1.2-1.3）同花顺：问财大模型内测申请开启；高情商的NPC来了，刚伸出手，它就做好了要配合下一步动作的准备；ChatGPT文明模拟器再上线，一键穿越回火山爆发当天的庞

刚刚，OpenAI发布了o1模型，国内可用

发表评论

推荐文章

VMware虚拟机在物理机win10系统下如何连接外网

ESP32 连接wifi（MicroPython）

移动硬盘文件或目录损坏且无法读取要怎么办啊

Mac无法读取硬盘

GAMES101——作业5 光线与三角形相交（菲涅尔反射率）

热门文章

u盘大计算机视频,处理视频太大在无法从电脑复制到U盘的操作方法

美多商城项目之用户登录：账号登录、QQ登录

【Selenium专题】WebDriver启动Chrome浏览器（一）

HUAWEI华为荣耀MagicBook Pro 锐龙版 AMD R5 集显 8GB+512GB (HLY-W19R)原装出厂Windows10系统恢复原厂OEM系统

电脑开机安装流氓软件、弹广告处理办法

FFmpeg开发(八)——Qt视频播放器之多线程的使用(参考了暴风影音、迅雷影音)

ubuntu彻底卸载搜狗拼音输入法

170819 四步安装Ubuntu 16.04 搜狗拼音输入法

【Python】教你如何蹭上隔壁的WiFi

ChatGPT 一统所有 AI 模型入口，四步实现文本分类、图像生成等 24 种复杂任务！...

最新文章

程序员写代码与厨师做菜、音乐家作曲、诗人写诗——其实，这是一篇程序员做饭指南

Visual Studio 2022平台的使用

GPT(Chat)原理及其应用

claude官方网站_claude官网入口_claude官网网址_claude中文官网

不足十天，HIR春季赛提交入口赛程安排提交指南奖项设置一文全

Slack工作区SolidUI 集成Claude使用流程，替代GPT3.5

【微服务】Spring Cloud Alibaba 的介绍以及和主要功能

AI Agent: AI的下一个风口 自然语言带来交互革命

GPT摆脱“AI味”：全面提升写作质感

CSDN的ChitGPT初体验，解决npm 报错 parcel

零基础小白如何备考2023年注册会计师

AI日报：当前最强国产Sora大模型Vidu发布；Kimi Chat移动端升级；通义千问开源首个千亿参数模型；苹果计划与 OpenAI 合作

毫无基础的人如何入门 Python ？--找对学习入口是关键！

清华智谱AI大模型ChatGLM-Pro申请开通详细教程

claude 3 官网_claude 3 中文官网_克劳德 ai官网入口

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

ZXMVC8900(V3

【模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313】模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313 官方免费下载

【生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD】生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD 官方免费下载

【模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311】模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311 官方免费下载

【模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311】模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311 官方免费下载

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改 官方免费下载

宝妈的需求“一仔播放器” WPF 的开源项目（一项目背景）

AI Agent: AI的下一个风口自然语言带来交互革命

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载