1.7B小模型超越16倍大模型 彻底摆脱云端依赖
5月7日,据官方公告,USDT发行商Tether的AI研究团队推出QVAC MedPsy系列医疗语言模型。
该模型专为智能手机、可穿戴设备等低算力终端设计,无需依赖云端服务器即可运行。
该模型通过高效架构实现远超模型大小的性能表现:1.7B参数版本在七项封闭式医疗基准上平均得分62.62,超出Google MedGemma-4B达11.42分,并在HealthBench Hard等真实临床场景中击败参数量大近16倍的MedGemma-27B;
4B参数版本得分达70.54,全面超越更大模型,同时推理token消耗最高减少3.2倍,以量化GGUF格式发布(1.7B版本约1.2GB),适配移动与边缘部署。
TETHer CEO Paolo Ardoino表示,该产品可在医院本地、设备端直接处理敏感医疗数据,无需传输至云端,能够降低成本、延迟与隐私风险,挑战了“更大模型=更好性能”的传统假设,有望重塑医疗AI基础设施,推动本地化部署在全球尤其是欠发达地区的普及。
免责声明:本站所有资讯仅代表作者个人观点,不构成任何投资理财建议。

