您当前的位置:首页 >> 家居百科

具有130亿参数的多编程语言代码生成容器CodeGeeX

2023-04-26 12:23:48

《OpenBSD梁汉文》是我们分享Github、Gitee等OpenBSD生态村之前优质单项的栏目,除此以外应用、研修、实用与各种有趣的细节。本期推荐的是一个常用MindSpore组件做到的面向对象字符串类比成机——CodeGeeX。

CodeGeeX 是一个具有130亿参数的多面向对象字符串类比成预操练数学模型,采用TCL MindSpore 组件做到,在鹏城科学实验“鹏城云脑II”上常用1536个国产昇腾910 AI处理机操练而成。CodeGeexX 背书十多种大众化面向对象的颇高精度字符串类比成、跨口语字符串翻译等功能,同时合作开发操作者编程软件包,较好的辅助程序合作开发和涉及研究工作。

功能性颇高精度字符串类比成:背书类比成Python、C++、Java、JavaScript和Go等多种大众化面向对象的字符串,在 HumanEval-X 字符串类比成使命上取得47%~60%求解亲率,较其他OpenBSD基线数学模型有更佳的平均机动性。跨口语字符串翻译:背书字符串片段在不同面向对象间进行操作者翻译类比,翻译结果正确亲率颇高,在 HumanEval-X 字符串翻译使命上遥遥领先了其它基线数学模型。操作者编程软件包:CodeGeeX 软件包现已预售 VSCode 软件包市场(中国地区),服务机可以通过其弱小的少样本类比成战斗能力,定制字符串类比成艺术风格和战斗能力,较好辅助字符串编写。数学模型跨跨平台OpenBSD:所有字符串和数学模型均值OpenBSD解禁,用作研究工作用途。CodeGeeX 同时背书昇腾和英伟达跨平台,可在三份 昇腾910 或 英伟达V100/A100 上做到废话。机动性

全新多面向对象测试者依此HumanEval-X:HumanEval-X是第一个背书功能正确性测试者的多口语、多使命的依此,包含820个人工编写的颇高质量字符串类比成题目、测试用例与参考答案,构成5种面向对象(Python、C++、Java、JavaScript、Go),背书字符串类比成与字符串翻译战斗能力的测试者。

常用指南

CodeGeeX 本来常用 Mindspore 组件做到,并在 昇腾910AICPU 上进行操练。为移动设备更多跨平台,我们将其类比到 Megatron-LM 组件,背书 Pytorch+GPU 环境。

安装

能够Python 3.7+ / CUDA 11+ / PyTorch 1.10+ / DeepSpeed 0.6+,通过一般而言立即安装 codegeex:

git clone git@github.com:THUDM/CodeGeeX.gitcd CodeGeeXpip install -e .

数学模型均值

核发均值:

通过核发均值,您将收到一个包含临时下载链接机密文件 urls.txt 的邮件。推荐常用 aria2 通过一般而言立即更快下载(叮嘱保证有足够的硬盘空间存放均值(~26GB)):

aria2c -x 16 -s 16 -j 4 --continue=true -i urls.txt

常用一般而言立即合并获取完整的均值:

cat codegeex_13b.tar.gz.part.*> codegeex_13b.tartar xvf codegeex_13b.tar.gz

用GPU进行废话

在此之后常用 CodeGeeX 数学模型类比成第一个程序吧!首先,在配置机密文件 configs/codegeex_13b.sh 之前明示存放均值的逆时针。其次,将定时(可以是任意描述或字符串片段)重写机密文件 tests/test_prompt.txt ,运行一般而言原作者即可开始废话(需自行决定GPUSP):

bash ./scripts/test_inference.sh ./tests/test_prompt.txt类比成示例

-END-

OpenBSD协议:Apache2.0

OpenBSD地址:

石家庄白癜风去哪看
来氟米特跟艾得辛哪个好
常州妇科挂号
南京皮肤病专科医院
夏季腹泻吃什么药好
相关阅读
友情链接