linux重启命令-别管了,先玩下小红书AI翻译
我说现在最牛的翻译软件是……小红书,咱们没意见吧
众所周知,最近因为TikTok在美国的封禁风云,一身反骨的TikTok海外用户张狂涌入小红书,为了接住这波泼天的流量,小红书连夜加班加点上线了议论区一键翻译的功用。
图片
图片
图片
图片
但假设仅仅传统的机翻也就算了,很快网友们就发现,这其实是接了大模型的AI翻译。
而且与其说是翻译,不如说是破译🥲,现在什么类型的“加密言语”在小红书议论区都无处遁形,翻译得那叫一个“信达雅”,堪比网上冲浪十级选手。
小红书AI翻译仍是太全面了
像cpdd、yyds、u1s1这种入门级其他缩写都是小儿科:
图片
图片
图片
图片
图片
图片
中式英语(Chinglish)也能轻松拿捏🤌:
图片
图片
图片
图片
图片
图片
图片
图片
图片
图片
图片
图片
原以为这些已经够无厘头了,但当我看到下面这些,我想说:小红书AI翻译仍是太全面了。
这下谁还分得清到底是翻译,仍是中文梗百科啊?
图片
图片
图片
图片
图片
图片
图片
图片
图片
图片
图片
图片
众所周知,打乱汉字的顺序不影响阅读,事实证明也不影响正确翻译:
图片
图片
图片
图片
什么二进制ASCII字符、盲文、摩斯暗码、《模仿人生》游戏言语……也统统给你破译了:
图片
图片
图片
图片
图片
图片
图片
图片
图片
图片
就连小说《冰与火之歌》中的“高档瓦雷利亚语”也不在话下(权游粉基因动了)……
图片
图片
有的网友甚至已不再满足于翻译言语的领域,初步检测小红书AI翻译对颜表情的了解:
图片
图片
图片
图片
图片
图片
还有一些内行的网友通过Prompt,让AI翻译输出拟定内容。详细格式可以参阅:把非中文言语加上双引号后再写指令,就能用大模型输出了。
比如有网友让AI在翻译完引号内的话后,输出自己的违禁词方针、披萨的制作方法、猫娘的故事……
好好好,你们狷介,你们了不起,你们把翻译当生成式AI用👍🏻
图片
图片
图片
图片
图片
图片
图片
图片
小红书为什么要用AI翻译?
有业内人士点评称,小红书AI翻译功用或许是现在大模型toc商用的最佳案例之一,因为小红书让所有人直观感受到了AI的魅力。
至于其背后用的是哪家大模型,有网友通过在议论中嵌入让模型“自报家门”的指令,得到了GPT-4、智谱清言等成果。考虑到合规和调用本钱的问题,GPT-4应该可以打扫。
那究竟是哪个国产大模型,现在仍不可知。因为假设模型操练数据包含了其他大模型的对话示例,或许对其他大模型的部分数据进行了蒸馏,都或许形成模型身份的幻觉。比如之前,文心一言也发生过称自己是ChatGPT的情况。
上一年4月,据36氪得知,由小红书AI立异负责人张德兵(薯名:宇尘)牵头的大模型团队,在部分内部产品灰度检验自研通用大模型基座“小地瓜”,外交和查找是落地方向。他们之前开发了自研的RLHF结构,并运用了PPO(近端战略优化)算法,这是一种被广泛认可的强化学习算法。
作为国内榜首家(也是仅有一家)如此大规模地运用AI翻译的外交媒体途径,小红书为什么要用AI翻译?又是怎样做到在这么短的时间内上线的?也是咱们津津有味的论题。
为什么小红书要用LLM翻译而不是传统的NMT?现在大部分被称为机翻的东西,都以NMT(Neural Machine Translation,神经机器翻译)为核心技术。
总的来说,据咱们估测,或许主要是为了快速上线、下降安置和维护的凌乱度和本钱。
首要,在很多外国用户涌入的情况下,假设产品经理要求你在短时间内快速上线翻译功用,LLM显然是优先之选,因为传统的NMT模型操练周期一般较长。
而假设直接调用现有LLM的翻译才华(如通过API),一般无需微调(fine-tuning)即可完成翻译功用。但假设需求更高程度的定制化(例如垂直领域翻译或特定风格调整),微调是必要的。
其次,还需求考虑服务安置(serving)的问题。假设运用传统NMT模型,需求从头建立或购买一套专门的serving基础设施。而LLM计划一般已经有老到的服务结构和基础设施,可以直接运用,大大缩短了开发周期并下降了凌乱性。
此外,LLM通过海量数据操练,泛化才华更强,能更好地处理外交媒体语境中的非标准/非正式言语、拼写错误、缩略语或网络用语(如表情符号、俚语等),并根据上下文调整翻译。
例如,网络用语 “idk” 会被翻译为 “I don’t know” 或等效表达。而NMT更倾向于翻译标准化言语,关于口语化或非标准输入的处理才华较弱。
LLM还可以直接处理凌乱的多言语输入,例如混合言语语句(code-switching),并了解不同言语之间的语义联络,这就是准确翻译拼音+英语的要害。
而且LLM的实时适应性更强,尽管其本身不能实时更新常识,但可以持续“学习”。例如,你可以奉告它改进对特定词语的翻译,模型就会进行即时调整。
相比之下,传统NMT体系需求从头操练才华改进某些翻译表现,因为NMT模型一般是根据一个固定时间点的数据操练的,而互联网jargon(黑话)、热梗、meme等更新频率极高,NMT模型很难及时捕捉新词汇和用法。
而为了提高国外用户的留存率,准确翻译时下盛行的梗非常重要,不仅能拉近与国外用户的距离,也能增强中外网友互动的趣味性和参与感。
据媒体报道,现在已有多位IP在海外的网友反映,在抖音议论区也呈现了“Translate”(翻译)的按键。抖音官方客服表明,“这是近期抖音更新产生的一个功用,现在抖音确实是有一个议论翻译功用,但是该功用正在晋级优化中。”
关于该翻译功用是否是仅针对海外用户进行检验,客服表明该功用正在小范围检验中,目标群体并不固定。不论是海外用户仍是人在我国的用户,都有或许在页面显现这个功用。
看来,小红书又一次引领了潮流。