← 返回新闻 新闻发布 · 2026 年 5 月 18 日

言澜大模型 V3.0 上线:中文发布前纠错再上一个大台阶

和 V2.0 一对一比,8 项核心指标全胜,47 项对比赢下 43 项。检得更多,叫错更少,整体能力再上新台阶。

开始使用 产品详情
8/8加权综合指标全胜
43/47总对比项胜出
95.74%准确率
94.16%完美修正率

言澜 V3.0 正式上线,中文发布前纠错再上一个大台阶。和 V2.0 一对一比,8 项核心指标全胜,47 项对比赢下 43 项;漏报率从 13.06% 一路压到 7.04%,误报继续下降。整体能力再上新台阶——每一项提升,皆有数据支撑。

中文发布前纠错的天花板,被言澜 V3.0 又顶高了一截。漏报从 13.06% 降到 7.04%,误报从 1.99% 降到 1.71%。检得更多,叫错更少——这一版可以正式纳入发布前审校流程。

适用场景:内容出版与政企文本

言澜 V3.0 主要服务对内容质量有高标准要求的政企客户:新闻出版机构的发稿前审校、出版社的图书与期刊定稿、政务部门的公文与新闻发布稿、金融与法务机构的合规文本、影视字幕与转写稿的成片质检。任何对外发布前需要一道严格中文校对的文本场景,言澜 V3.0 都能稳定承接。

最难发现的错误,正是它的主场

V3.0 没有把目标放在常规错别字检出率上。它针对的是发布前最难处理的那类内容——错误隐蔽、强依赖上下文、行业术语密集、改错容错率极低。我们为此重构了高难度中文纠错评测集,并升级数据合成引擎,让模型对抗的文本更贴近真实发布流程。

更敢检错。 漏报率直降 6.02 个百分点,C-Recall 同步跃升 6.02 个百分点。再隐蔽的错误,也无处遁形。
更少误伤。 误报率继续走低,C-Precision 稳守 98.30%。审校团队不再被无效告警分散精力。
更会修正。 完美修正率从 84.66% 一路推到 94.16%——单项提升 9.5 个百分点。指出问题易,给出可直接采用的修正,才是发布前纠错的核心价值。

8 项核心指标,全面胜出

三组高难度样本(484 / 991 / 2933)按数量加权后,每一项 V3.0 都赢——准确率、F1、F0.5、漏报率、误报率、修正精度、修正召回、完美修正率。没有选择性披露,没有规避短板。

V3.0 相对 V2.0 的提升幅度(百分点) 完美修正率 +9.50 漏报率 (FPR) ↓ −6.02 修正召回 +6.02 F0.5 +4.39 准确率 +3.32 F1 +2.84 修正精度 +0.52 误报率 (FNR) ↓ −0.28
三组高难度样本(n=484 / 991 / 2933)按数量加权综合。8 项指标 V3.0 全面胜出,无回退。
95.74%准确率 · V3.0(+3.32 pp)
7.04%漏报率 · V3.0(−6.02 pp)
1.71%误报率 · V3.0(−0.28 pp)
94.16%完美修正率 · V3.0(+9.50 pp)

47 项对比,43 项胜出 — 系统性领先

发布前纠错从来不是单项比拼。检错、修正、误伤控制、生产稳定性——任何一项掉队,都意味着上线风险。V3.0 在 47 项对比中赢下 43 项,覆盖每个数据集、每个指标。系统级的能力提升,不靠任何一个单点的偶然突围。

47 项对比的胜负分布 V3.0 赢 43 项 · 91.5% V2.0 赢 4 项 · 8.5%
拆分到单数据集 × 单指标的 39 项明细中,V3.0 也以 35:4 大幅领先;加权综合 8 项全胜。

最大的提升,来自「真正改对」这一关

指出「这里可能有问题」相对容易;难的是给出一个能直接采用的修正——多数校对模型恰好在这一步失守。V3.0 提升幅度最大的指标也正好落在这里:完美修正率在三组数据集上全线跃升至 93% 以上。

完美修正率:三项任务上 V2.0 → V3.0 全线跃升 横轴展示 80% – 100% 区间 任务 1 V3.0 · 95.59% V2.0 · 85.25% +10.34 pp 任务 2 V3.0 · 94.82% V2.0 · 84.22% +10.60 pp 任务 3 V3.0 · 93.78% V2.0 · 84.68% +9.10 pp
言澜 V3.0 言澜 V2.0
三项高难度评测任务(任务 1:n=484;任务 2:n=991;任务 3:n=2933)上完美修正率同步抬升,提升幅度均在 +9 个百分点以上——表现稳定,不靠单一任务撑场。

完整评测在三项内部高难度任务上完成(样本量 484 / 991 / 2933),覆盖发布前多类高标准内容。如需逐项原始数据,欢迎联系业务团队。

言澜 V3.0 现已全面上线

发布前文字纠错的业内新标杆。8 项核心指标全胜,47 项对比 43 项胜出,漏报率降至 7.04%,完美修正率达 94.16%。已服务新闻出版、政府政务、金融法务、影视字幕等高标准内容场景。欢迎政企客户联系试用,体验言澜 V3.0 在贵机构真实文本上的纠错能力。

开始使用 → 联系业务团队