秘塔AI发布全新“超速”模型,实现400 tokens/s的极速响应,快速搜索与即刻回馈

是的,秘塔AI搜索推出了全新“极速”模型


通过在GPU上进行kernel fusion,以及在CPU上进行动态编译优化,我们在单张H800 GPU上实现了最高400 tokens/秒的响应速度,大部分问题2秒内就能答完。


新版模型不仅更快,准确率更高,逻辑也更清晰。


秘塔AI推出“极速”模型,400 tokens/s,你搜索,我秒回


我们随机测试了以下两个问题。


问题1,为什么撕拉片突然火了?


这个问题采用了“极速”作答:


秘塔AI推出“极速”模型,400 tokens/s,你搜索,我秒回



(真实录屏,没有倍速)


问题2,请总结2015年至今关于CRISPR-Cas9在治疗遗传性疾病中的研究进展。


这个问题采用了“极速·思考”作答:


秘塔AI推出“极速”模型,400 tokens/s,你搜索,我秒回



(真实录屏,没有倍速)


为了更直观的体验,我们还做了一个测速站点 👉kuai.metaso.cn


秘塔AI推出“极速”模型,400 tokens/s,你搜索,我秒回




发表评论