黑馬校對(北京黑馬飛騰公司開發的系統)

黑馬校對V21 是北京黑馬飛騰科技有限公司全力開發的新一代校對系統,榮獲「中國優秀軟件」終身稱號並且通過了中國版協校委會的實測鑒定。內含S2版、PS版、Word版、WPS版、小樣版、飛騰插件版和PDF插件版等9個全新的校對界面,採用超大規模詞庫和重點詞監控等先進的校對計算技術,在校對質量、校對功能和易用性等方面都有了飛躍性的提高,達到了當前電腦校對軟件發展的最高水平,智能技術居於國際領先水平。

黑馬校對V21的研製基於覆蓋社會科學和自然科學各領域的10000億字漢語語料的分析,採用國際計算語言先進的語法分析和語料庫統計相結合的方法,具有漢語切分技術、漢語語法分析技術、漢語依存關係分析技術等 優秀的中文智能技術。內嵌79個專業詞庫、8000萬條專業詞彙、600萬條錯誤核心庫,查錯準確率和校對效率已經達到一個嶄新的高度。

支持各種主流文字處理和排版系統的文件格式,支持各種專業文稿的校對。黑馬校對系統是國內市場上佔有率最高、實用性最強的專業校對軟件,為各類文稿的校對提供最佳解決方案。

全國已經有98%以上的出版社、近萬家的報社雜誌社、印刷企業、圖書公司和機關辦公等單位和個人使用黑馬校對系統。

版本

功能特點

校對功能

可以校對大部分中文錯別字、多字、少字、人名、地名、英文(單詞拼寫)、部分成對標點、科技計量、重句、異形詞、也作、曾用詞等各類錯誤。

校對大部分領導人姓名、職務和領導人排序錯誤。

校對大部分涉及台灣和其他敏感的政治性錯誤。

即時更新的、可自定義的領導人職務庫。

直接嵌入在Acrobat中校對PDF文件。可把校對標記轉換成註釋結果,便於他人查看。

直接嵌入在Word、WPS中,編輯和校對相結合。

直接嵌入在飛騰系統中,排版、校對相結合。

支持Acrobat6.0~DC專業版;支持Office2000~2016版;支持WPS 2007~2016版;支持飛騰3.1~5.4版;支持飛翔2012~7。

8000萬條專業詞庫

首屈一指的大規模專業詞庫,專業詞庫詞彙量超過8000萬條,包括物理、數學、機械、紡織、氣象、歷史、考古、文物、交通、郵電、環境、農林牧漁、化學、石化、冶金、煤炭、建築、水利、圖書、印刷、醫學、生物、心理、經濟、證券、會計、財政、審計、電腦、電子、電力、新聞、政治、哲學、教育、少兒、文學、戲曲、電影、廣電、法律、宗教、民族、軍事、航空、地理、地質等79個專業詞庫。覆蓋1000億字高質量語料。符合全國科學技術名詞審定委員會的標準。

校對技術

根據需求定製重點詞監控詞庫,能夠準確快速地校對出所有與重點詞相似的錯誤,支持大容量的重點詞監控庫。特別適合於檢查領導人姓名、單位名稱、地名以及涉及中央重要精神的詞語等。

依據標準

⑴ 《現代漢語詞典》第7版(商務印書館)

⑵ 全國科學技術名詞審定委員會審定的各科科技名詞全書

⑶ 《中國人名地名大辭典》

⑷ 《第一批異形詞整理表說明》 (語文出版社)國家語委2002年3月頒佈

⑸ 《辭海》1999年版(上海辭書出版社)

⑹ 《中國成語大詞典》 (上海辭書出版社)

⑺ 《使用語言文字規範指南》 (上海辭書出版社)

⑻ 《外國地名譯名手冊》(中型本)中國地名委員會編(商務印書館)

⑼ 《英語姓名譯名手冊》第四版 新華通訊譯名資料組 編(商務印書館)

用戶詞庫

自由定義用戶庫、錯誤庫、重點詞監控庫、敏感庫、建議庫、領導人職務庫和排序庫等詞庫,量身打造校對標準。可以自由掛接外來詞庫。

出版工具

S2版可同步校對大樣和小樣文件,能夠直接對照大樣文件無損修改小樣文件。

方便實用的生成勘誤表功能。

強大的批量查找功能,輔助校對和建立索引。

句庫匹配,輕鬆校對文中引語是否與原句匹配。

高效的提取生詞功能,輕鬆擴建用戶詞庫。

先進的大樣轉文本和小樣排版符號剝離工具。

嚴格審定的大型成語查詢庫和各類知識庫。

技術原理

1. 正向查錯

依靠語言模型來進行漢語依存關係分析,也就是對大量分類語料中的上下文和語句關係進行量化的統計、分析、提煉,並採用高倍信息壓縮、快速檢索、漢字高精度快速切分等先進技術 來生成語言模型和依存分析算法。

語言模型中知識庫詞條達4800萬條之多。

為提煉不同領域的文字特徵,黑馬分析處理了涵蓋自然科學、社會科學十大分支的300億漢語語料,同時鑒於中文的複雜性,為了提高語言模版的準確性和減少信息垃圾,我們每年投入30餘名數據處理人員對計算機智能分析結果進行人工核查。

2. 反向查錯

黑馬公司長期堅持不懈地大量收集各種常見錯誤,包括:寫作人員似是而非錯誤、五筆字型錄入人員常見錯誤、拼音錄入常見錯誤、OCR識別有規律的錯誤、各專業廢除詞條、不規範科技計量單位、國家語委確定的非規範詞條、各類政治性錯誤等。

3. 從實際需求出發,增強校對功能

黑馬校對軟件不僅在核心技術上保持着領先地位,而且還針對廣大用戶的實際使用地改進版本,擴大軟件的適應性,使其更具實用價值。

黑馬校對系統的早期版本可以校對各種排版格式的小樣文件,後來為方便校對人員對稿,增加了把大樣文件轉換成文件文件,保留頁碼信息的功能。後來,黑馬公司研製出軟件RIP技術,開發了可以直接顯示並校對大樣文件的S2版和PS版。為了方便編輯、排版人員的校對和修改,開發出了嵌入到Word中校對的Word版、嵌入到WPS中的WPS版、嵌入到Acrobat中的PDF版和嵌入方正飛騰等排版系統的飛騰插件版。

錯誤類型

黑馬校對V21版內含800萬條錯誤規則庫和8000萬條專業庫,具有強大的查錯能力,能夠精確校對政治性問題(領導人姓名、職務、排序,台灣問題,敏感詞語等)、中文(錯別字、少字、多字、詞語搭配和部分語法語義、異形詞和繁體字、「也作」和曾用詞、知識性錯誤、人名、地名等各種錯誤)、英文拼寫、標點、數字、科技計量單位、重句等各種錯誤,部分校對界面(S2版)還可以校對目錄、標題和序號等錯誤。

下面列舉一些黑馬校對可以檢查的錯誤類型(括號外為錯誤詞條):