分享
Scan me 分享到微信

苹果研发出高效文本生成模型FS-DFM

苹果公司与俄亥俄州立大学合作,近日推出名为“少步离散流匹配”(FS-DFM)的新型语言模型。该扩散模型变体仅需8轮迭代,即可生成与传统模型上千步迭代质量相当的文本,效率提升高达128倍。与传统逐字生成的自回归模型不同,FS-DFM采用并行策略,通过教师模型引导和迭代机制优化,在保证文本质量的同时大幅缩短生成时间。测试显示,参数量仅1.7亿至17亿的FS-DFM变体,在困惑度和熵值两项关键指标上均优于参数量更大的同类模型。(DoNews)
喜欢您正在阅读的内容吗?欢迎免费订阅泰伯每周精选电邮。 立即订阅

24小时最热快讯