谷歌推出 DataGemma：基于可信数据源提高 AI 准确度，减少幻觉

谷歌公司基于谷歌数据共享（Data Commons）中的真实世界统计数据，推出了开放权重 Gemma 模型的新版本 DataGemma。谷歌的 Data Commons 是一个存储库，汇集了来自联合国和疾病控制与预防中心等可信组织收集的超过 2400 亿个数据点。通过利用这一庞大的统计数据集，基于 Gemini 的 DataGemma 能够显著提升模型准确性，确保其输出基于真实可信的现实世界信息。DataGemma 方法的核心在于两种关键技术：检索交错生成（RIG）和检索增强生成（RAG）。这两种方法通过在生成过程中将模型基于现实世界数据，从而减少幻觉现象。

+友情链接