黑馬校對
北京黑馬飛騰公司開發的系統
黑馬校對V21 是北京黑馬飛騰科技有限公司全力開發的新一代校對系統,榮獲“中國優秀軟體”終身稱號並且通過了中國版協校委會的實測鑒定。內含S2版、PS版、Word版、WPS版、小樣版、飛騰插件版和PDF插件版等9個全新的校對界面,採用超大規模詞庫和重點詞監控等先進的校對計算技術,在校對質量、校對功能和易用性等方面都有了飛躍性的提高,達到了當前電腦校對軟體發展的最高水平,智能技術居於國際領先水平。
黑馬校對V21的研製基於覆蓋社會科學和自然科學各領域的10000億字漢語語料的分析,採用國際計算語言先進的語法分析和語料庫統計相結合的方法,具有漢語切分技術、漢語語法分析技術、漢語依存關係分析技術等 優秀的中文智能技術。內嵌79個專業詞庫、8000萬條專業辭彙、600萬條錯誤核心庫,查錯準確率和校對效率已經達到一個嶄新的高度。
支持各種主流文字處理和排版系統的文件格式,支持各種專業文稿的校對。黑馬校對系統是國內市場上佔有率最高、實用性最強的專業校對軟體,為各類文稿的校對提供最佳解決方案。
全國已經有98%以上的出版社、近萬家的報社雜誌社、印刷企業、圖書公司和機關辦公等單位和個人使用黑馬校對系統。
單機版 | 多機版 | 限字版 |
單機版配有一個硬體加密鎖,安裝和使用時必須插鎖。不限制固定電腦安裝,是黑馬校對用戶群最多的版本。 單機版、多機版和限字版在校對功能上都是完全相同的。單機版、限字版同時只能在一台電腦上使用,而多機版可以多機同時使用 。 | 多機版是一個多用戶優惠版本,授權在一個單位內部使用,可以多人同時使用。多機版採用“母鎖+子鎖”的方式,即一個母鎖(側邊橘紅色)用於安裝,數量為授權台數的多個子鎖(側邊深藍色)用於使用。多機版在安裝時不限制安裝台數、安裝次數,使用時插上子鎖即可。 | 限字版是專門為期刊用戶開發的校對軟體。功能與單機版完全一樣,只不過累計校對字數限制在800萬字。字數用完后交少許費用可補充800萬字。補充字數時,若有新版,可免費升級到新版。 |
可以校對大部分中文錯別字、多字、少字、人名、地名、英文(單詞拼寫)、部分成對標點、科技計量、重句、異形詞、也作、曾用詞等各類錯誤。
校對大部分領導人姓名、職務和領導人排序錯誤。
校對大部分涉及台灣和其他敏感的政治性錯誤。
即時更新的、可自定義的領導人職務庫。
直接嵌入在Acrobat中校對PDF文件。可把校對標記轉換成註釋結果,便於他人查看。
直接嵌入在Word、WPS中,編輯和校對相結合。
直接嵌入在飛騰系統中,排版、校對相結合。
支持Acrobat6.0~DC專業版;支持Office2000~2016版;支持WPS 2007~2016版;支持飛騰3.1~5.4版;支持飛翔2012~7。
黑馬校對 | 黑馬校對 |
首屈一指的大規模專業詞庫,專業詞庫辭彙量超過8000萬條,包括物理、數學、機械、紡織、氣象、歷史、考古、文物、交通、郵電、環境、農林牧漁、化學、石化、冶金、煤炭、建築、水利、圖書、印刷、醫學、生物、心理、經濟、證券、會計、財政、審計、電腦、電子、電力、新聞、政治、哲學、教育、少兒、文學、戲曲、電影、廣電、法律、宗教、民族、軍事、航空、地理、地質等79個專業詞庫。覆蓋1000億字高質量語料。符合全國科學技術名詞審定委員會的標準。
根據需求定製重點詞監控詞庫,能夠準確快速地校對出所有與重點詞相似的錯誤,支持大容量的重點詞監控庫。特別適合於檢查領導人姓名、單位名稱、地名以及涉及中央重要精神的詞語等。
⑵ 全國科學技術名詞審定委員會審定的各科科技名詞全書
⑶ 《中國人名地名大辭典》
⑷ 《第一批異形詞整理表說明》 (語文出版社)國家語委2002年3月頒布
⑸ 《辭海》1999年版(上海辭書出版社)
⑹ 《中國成語大詞典》 (上海辭書出版社)
⑺ 《使用語言文字規範指南》 (上海辭書出版社)
⑻ 《外國地名譯名手冊》(中型本)中國地名委員會編(商務印書館)
⑼ 《英語姓名譯名手冊》第四版 新華通訊譯名資料組 編(商務印書館)
自由定義用戶庫、錯誤庫、重點詞監控庫、敏感庫、建議庫、領導人職務庫和排序庫等詞庫,量身打造校對標準。可以自由掛接外來詞庫。
S2版可同步校對大樣和小樣文件,能夠直接對照大樣文件無損修改小樣文件。
方便實用的生成勘誤表功能。
強大的批量查找功能,輔助校對和建立索引。
句庫匹配,輕鬆校對文中引語是否與原句匹配。
高效的提取生詞功能,輕鬆擴建用戶詞庫。
先進的大樣轉文本和小樣排版符號剝離工具。
嚴格審定的大型成語查詢庫和各類知識庫。
1. 正向查錯
依靠語言模型來進行漢語依存關係分析,也就是對大量分類語料中的上下文和語句關係進行量化的統計、分析、提煉,並採用高倍信息壓縮、快速檢索、漢字高精度快速切分等先進技術 來生成語言模型和依存分析演演算法。
語言模型中知識庫詞條達4800萬條之多。
為提煉不同領域的文字特徵,黑馬分析處理了涵蓋自然科學、社會科學十大分支的300億漢語語料,同時鑒於中文的複雜性,為了提高語言模版的準確性和減少信息垃圾,我們每年投入30餘名數據處理人員對計算機智能分析結果進行人工核查。
2. 反向查錯
黑馬公司長期堅持不懈地大量收集各種常見錯誤,包括:寫作人員似是而非錯誤、五筆字型錄入人員常見錯誤、拼音錄入常見錯誤、OCR識別有規律的錯誤、各專業廢除詞條、不規範科技計量單位、國家語委確定的非規範詞條、各類政治性錯誤等。
3. 從實際需求出發,增強校對功能
黑馬校對軟體不僅在核心技術上保持著領先地位,而且還針對廣大用戶的實際使用地改進版本,擴大軟體的適應性,使其更具實用價值。
黑馬校對系統的早期版本可以校對各種排版格式的小樣文件,後來為方便校對人員對稿,增加了把大樣文件轉換成文件文件,保留頁碼信息的功能。後來,黑馬公司研製出軟體RIP技術,開發了可以直接顯示並校對大樣文件的S2版和PS版。為了方便編輯、排版人員的校對和修改,開發出了嵌入到Word中校對的Word版、嵌入到WPS中的WPS版、嵌入到Acrobat中的PDF版和嵌入方正飛騰等排版系統的飛騰插件版。
黑馬校對V21版內含800萬條錯誤規則庫和8000萬條專業庫,具有強大的查錯能力,能夠精確校對政治性問題(領導人姓名、職務、排序,台灣問題,敏感詞語等)、中文(錯別字、少字、多字、詞語搭配和部分語法語義、異形詞和繁體字、“也作”和曾用詞、知識性錯誤、人名、地名等各種錯誤)、英文拼寫、標點、數字、科技計量單位、重句等各種錯誤,部分校對界面(S2版)還可以校對目錄、標題和序號等錯誤。
下面列舉一些黑馬校對可以檢查的錯誤類型(括弧外為錯誤詞條):
序號 | 錯誤類型 | 錯誤樣本 |
1 | 領導人姓名、職務搭配、排序錯誤 | 國家領導人的姓名錯誤,職務姓名搭配錯誤,以及先後排序錯誤等。 |
2 | 涉及台灣等的政治性問題 | 把台灣當成國家看待,和其他有關規定不允許的政治性錯誤。 |
3 | 其他敏感的政治性問題 | 宗教問題,敏感辭彙等。 |
4 | 拼音類錯別字 | 【拼音類錯誤】: 登計費(正:登記費);的台蘚(正:的苔蘚);兩隻槍(正:兩支槍); 投名壯(正:投名狀);邁卡錫(正:麥卡錫);易拉灌(正:易拉罐); 不在心煩(正:不再心煩);調節選鈕(正:調節旋鈕); 藍球賽場(正:籃球賽場);旅客需知(正:旅客須知); 十分煩重(正:十分繁重);無可挑替(正:無可挑剔); 形式微秒(正:形式微妙);巡行導彈(正:巡航導彈); 一幅楹聯(正:一副楹聯);一副油畫(正:一幅油畫); 一擊悶棍(正:一記悶棍);佔了上峰(正:佔了上風); 迅雷不急掩耳(正:迅雷不及掩耳);挾天子已令諸侯(正:挾天子以令諸侯); 人面桃花相應紅(正:人面桃花相映紅); |
5 | 字形類錯別字 | 【字形類錯誤】: 抱括(正:包括);笫四(正:第四); 大咸價(正:大減價);負責表(正:負債表); 摸不者(正:摸不著);字盂德(正:字孟德); 愛菅閑事(正:愛管閑事);巴彥卓爾(正:巴彥淖爾); 瓜瓜墜地(正:呱呱墜地);卡巴斯其(正:卡巴斯基); 兩個波型(正:兩個波形);聲名遠場(正:聲名遠揚); 展觀風采(正:展現風采);大漢口文化(正:大汶口文化); 迴旋自治區(正:回族自治區);客戶瑞生成(正:客戶端生成); 有機化台物(正:有機化合物);阿爾及尼亞(正:阿爾及利亞); 莫定了基礎(正:奠定了基礎);條件效成熟(正:條件較成熟); 世界人大奇景(正:世界八大奇景);給子行政處分(正:給予行政處分); 興隆街居委公(正:興隆街居委會);走了很多地萬(正:走了很多地方); |
6 | 成語錯誤 | 【成語錯誤】: 百轉干回(正:百轉千回);暴斂天物(正:暴殄天物); 篳路籃縷(正:篳路藍縷);彪炳千古(正:彪炳千古); 綺旎風光(正:旖旎風光);千斤買鄰(正:千金買鄰); 權益之計(正:權宜之計);神態自苦(正:神態自若); 水滴石川(正:水滴石穿);四海生平(正:四海昇平); 他山之後(正:他山之石);貪贓王法(正:貪贓枉法); 一蹴不振(正:一蹶不振);一丘之豹(正:一丘之貉); 肄意妄為(正:肆意妄為);鄭重其是(正:鄭重其事); 捉襟見紂(正:捉襟見肘);自相茅盾(正:自相矛盾); |
7 | 少字錯誤 | 【少字】: 成本管研究(正:成本管理研究);國家安全員會(正:國家安全委員會); 馬克列寧主義(正:馬克思列寧主義); |
8 | 多字錯誤 | 【多字】: 其實是是對(正:其實是對);它的的功能(正:它的功能); 放射性元元素(正:放射性元素);統計局統計局(正:統計局); |
9 | 錯位錯誤 | 【錯位】: 熱鬧場的面(正:熱鬧的場面);讓大人跌眼鏡(正:讓人大跌眼鏡); |
10 | 詞語搭配錯誤 | 【詞語搭配錯誤】: 他的丈夫(正:她的丈夫);冰雪熔化(正:冰雪融化); 記念勝利(正:紀念勝利);精減機構(正:精簡機構); 清楚毒素(正:清除毒素);心理沒底(正:心裡沒底); 危急人體健康(正:危害人體健康); 消費者想賣什麼(正:消費者想買什麼); |
11 | 的地得錯誤 | 【的、地、得相關錯誤】: 更快的找到(正:更快地找到);全神貫注的聽著(正:全神貫注地聽著); 回家地路上(正:回家的路上);印章得時候(正:印章的時候); 看的上眼(正:看得上眼);急的要命(正:急得要命); 忙的天昏地暗(正:忙得天昏地暗);妙的很(正:妙得很); |
12 | 語法錯誤 | 【語法錯誤】: 1.進一步障礙了社會的發展。(“障礙”用詞不妥,應改為動詞“阻礙”。) 2.頂不住壓迫而喪失了原則。(“壓迫”是動詞,應改為名詞“壓力”。) 3.他的白血球指數比正常值少三倍。(表示數量的減少,不能用倍數。) 4.曹雪芹的足跡走遍了香山。(“足跡”和“走遍”不搭配。) |
13 | 異形詞 | 【異形詞】: 定貨(正:訂貨);簡煉(正:簡練); 秀外惠中(正:秀外慧中);直接了當(正:直截了當); |
14 | 繁體字詞 | 【繁體字詞】: 什麽(正:什麼);金庫(正:金庫); 於是按照(正:於是按照);文王生於(正:文王生於); |
15 | “也作”錯誤 | 【“也作”】(《現代漢語詞典》中沒有條目或註解的“也作xx”的非推薦詞條): 樹陰(正:樹蔭);想像(正:想象); 其它(正:其他);撤消(正:撤銷); 背不住(正:備不住);虎踞龍蟠(正:虎踞龍盤); |
16 | 曾用名錯誤 | 【曾用名】(曾經使用過的醫學不規範名詞): 乙醯水楊酸(正:阿司匹林); |
17 | 知識性錯誤 | 【知識性錯誤】: 廣州黃浦(正:廣州黃埔);上海黃埔(正:上海黃浦); 廣東河池(正:廣西河池);廣西雷州(正:廣東雷州); 河北省信陽(正:河南省信陽);江西省宜興(正:江蘇省宜興); 陝西河津(正:山西河津);廣西省(正:廣西壯族自治區); 國家林業部(正:國家林業局);美國劍橋大學(正:英國劍橋大學); |
18 | 人名錯誤 | 【人名錯誤】: |
19 | 地名錯誤 | 【地名錯誤】: |
20 | 英文拼寫錯誤 | 【英文拼寫】: Shares worldwide have risen strongly after the latast signs of an econamic recovery in the US.Shares on Wall Street continiued upwards thanks to better-than-expected industrial producation data.The Dow Jones Industrial Averag closed up 107.5 points, or 1.1%, at 9,791, which was an 11-monlth high. It has now risen for eight of the past nine days. |
21 | 標點錯誤 | 【標點錯誤】: 1.看到<經濟參考報》對3萬多農民深受”高價電”之苦的報道感到震驚。 2.佔四川省生產總值的46%左右,。 3.他笑著說::‘很好,就這麼辦!” 4.雨還在悄悄地下著……。 5.老張說道:”快點,晚了就來不及了。 |
22 | 數字性錯誤 | 【數字性錯誤】: 他303歲(不符合現實);在19882年22月36日(錯誤的年月日); 2月31日(2月沒有31日);到了99年(不規範寫法,應為1999年); 淳熙8年(正:淳熙八年);二0年(正:20年); |