您的当前位置:首页 > 百科 > AI大模子的语言不同过错等:英语最重价,此外语言要贵良多 正文
时间:2025-03-05 00:15:31 来源:网络整理 编辑:百科
原问题:AI大模子的语言不同过错等:英语最重价,此外语言要贵良多7 月 31 日新闻,用户所运用的语言对于大型语言模子LLM)的用度有很大的影响,可能组成英语运用者以及此外语言运用者之间的家养智能边界
7 月 31 日新闻,言不英语言贵用户所运用的同过语言对于大型语言模子(LLM)的用度有很大的影响,可能组成英语运用者以及此外语言运用者之间的最重家养智能边界。最近的外语一项钻研展现,由于 OpenAI 等效率所接管的良多的效率器老本掂量以及计费的方式 ,英语输入以及输入的大模的语用度要比其余语言低良多,其中简体中文的言不英语言贵用度约莫是英语的两倍 ,西班牙语是同过英语的 1.5 倍,而缅甸的最重掸语则是英语的 15 倍 。
IT之家留意到 ,外语推特用户 Dylan Patel(@dlan522p)分享了一张照片,良多揭示了牛津大学妨碍的大模的语一项钻研,该钻研发现 ,言不英语言贵让一个 LLM 处置一句缅甸语句子需要 198 个词元(tokens),同过而同样的句子用英语写惟独要 17 个词元 。词元代表了经由 API(如 OpenAI 的 ChatGPT 或者 Anthropic 的 Claude 2)碰头 LLM 所需的合计力老本,这象征着缅甸语句子运用这种效率的老本比英语句子逾越 11 倍 。
词元化模子(即家养智能公司将用户输入转换为合计老本的方式)象征着 ,除了英语之外的其余语言运用以及磨炼模子要贵良多 。这是由于像中文这样的语言有着差距 、更重大的妄想(不论是从语法仍是字符数目上),导致它们需要更高的词元化率。好比 ,凭证 OpenAI 的 GPT3 分词器 ,“你的爱意(your affection)”的词元,在英语中惟独要两个词元,但在简体中文中需要八个词元 。尽管简体中文文本惟独 4 个字符(你的爱意),而英文有 14 个字符 。
【源头:IT之家】返回搜狐,魔难更多
责任编纂:
10队争4个淘汰赛名额!欧冠乱了,大巴黎赢球晋级,2豪门近乎出局2025-03-05 00:12
【观察】弗赖堡,突然成了德国足球人才基地赵露思因涉嫌不当言论被央视开除、账号被清黑、吴磊受牵连2025-03-04 23:56
楼·芒果青年码头魔术大秀!“魔幻”时刻就在湘潭2025-03-04 23:14
腾讯混元大模子批量上新:10秒天生AI图像,逾越180个腾讯营业接入2025-03-04 23:03
文班21+20,马刺吞16连败!德罗赞末节发威,公牛拒绝摆烂忍耐力强的孩子,在三个方面的表现更胜一筹,但少有父母重视培养2025-03-04 22:57
重回上海的费德勒,成了申花球迷?细思极恐的“260斤偏瘦小娇妻”,毁掉一个人,狠狠宠她就够了2025-03-04 22:40
原创雄鹿想要的一切,表男全给了2025-03-04 22:23
意甲:拉齐奥VS佛罗伦萨,拉齐奥寻求反弹,主场优势明显2025-03-04 22:13
亚冠罚单将至浙江残阵南征墨尔本 莱昂纳多停8场?“亚洲第一美胸”:因潘金莲成名,28岁住豪宅,如今沦落到卖拉面2025-03-04 21:43
勇士惜败,时光残酷记忆顽固,库里还是库里杜兰特不再是杜兰特主席70岁生日当天和江青合影,两人表情严肃,很亲切2025-03-04 21:39
原创 中超没落!亚洲外教获青睐,K联赛最佳主帅将加盟,2队成潜在东家2025-03-05 00:08
风暴眼丨国安输球痛失亚冠资格 主场谢幕战留下无尽遗憾骗了我们49年!原来他就是吴京的父亲,难怪吴京能大红大紫2025-03-05 00:02
原创 豪门悲喜夜!国米带着现任打前夫,AC米兰一胜难求,曼城吊打曼联2025-03-04 23:42
德甲丨半场狂灌8球 这样的拜仁太“恐怖”回顾:许家印背后的三座“靠山”,一位去世、一位瘫痪,身份都不一般2025-03-04 23:39
0-3=出线!中超亚军拒绝爆冷,亚冠PK日本第2,13分稳拿第12025-03-04 23:35
长沙警方传递多人持械打架14人被抓:网帖品评激发矛盾2025-03-04 23:09
4年2.07亿,再见太阳!凤凰城大生意或者成败笔,杜兰特的噩梦重现2025-03-04 22:22
胖虎24分,英格拉姆26分,鹈鹕大胜尼克斯2025-03-04 21:41
浙江队5人遭禁赛!亚足联公布亚冠罚单,武里南造冲突者逃过处罚又一领土回归中国版图,面积4.7平方千米,五处竖界碑宣告主权2025-03-04 21:38
难以定义的天纵奇才!文班亚马强势带队夺生涯首胜星二代扯下“遮羞布”,衣不蔽体行为太开放,她们的父母真淡定2025-03-04 21:30