常用國字標準字體表

维基百科,自由的百科全书

中華民國教育部在1973年(民國62年)委託國立臺灣師範大學國文研究所成立專案小組,負責研訂國民常用字標準字體。經長期的研訂和試用,在1982年(民國71年)正式啟用《常用國字標準字體表》,共計收錄4808個字[1][2]。在1996年(民國85年),教育部公佈《常用國字標準字體筆順手冊》,用國字標準字體說明常用字的筆順

教育部正字及異體字表

中華民國教育部頒布的國字標準字體以及異體字,如下[1]

  • 常用國字標準字體表,簡稱甲表ISBN 9789570906646,教育部於1978年5月印行,內附「教育部社會教育司委託國立臺灣師範大學國文研究所研訂常用國字及標準字體總報告」。收到各界意見修訂後,委由正中書局於1979年6月出版,於1982年9月1日作為常用字字體標準正式啟用,內收4,808字。
  • 次常用國字標準字體表,簡稱乙表ISBN 9786660913003,於1982年10月印行,12月出版的次常用字和字體標準,內收6,341字。1993年公佈的《國字標準字體楷書母稿》中,次常用字為6,343字。在最新版的《異體字字典》附錄,次常用字更訂為6,329字[3]
  • 罕用國字標準字體表,簡稱丙表ISBN 9786660913010,於1983年10月印行,隔年4月出版的的罕用字和字體標準,內收18,388字。在最新版的《異體字字典》附錄,罕用字更訂為18,319字。
  • 異體國字字表,簡稱丁表,於1984年3月印行的異體字標準,內收異體18,588字,補遺22字。在最新版的《異體字字典》附錄,收異體字70,955字。

教育部國家教育研究院負責維護的《異體字字典》附錄收有〈正字表〉。該表依據教育部常用字、次常用字、罕用字三個標準字體表訂定;遇有具獨立音義而三字表未收之字形,則補收為新正字。聯綿詞為描摹語音而設,故有多種字形,其異形之用字,原則上均視為獨立正字,除非文獻明示正異關係或字構可見孳乳線索[4][5]。據《異體字字典》正式六版(2017年)所收正字編錄,計收29,921字。

研訂方法

常用國字標準字體表(甲表)

1973年2月,由「國字整理小組」擴編的「常用國字編纂處」在林尹周何李鍌陳新雄李殿魁張文彬于大成王熙元胡自逢許錟輝黃永武黃慶萱等文字學學者的領導下,著手進行常用標準國字的整理工作。其收字及選字標準為,從中文大辭典編纂處 「總字表」(49905字)、師大國文研究所「常用字表」(2408字)及教育部「國民學校常用字彙表」(4864字)中,合併統計其總出現次數,再參酌各方意見修訂而成[4][6][1][7]

  • 總字表:從《中文大辭典》、《辭源》等十五種參考工具書[註 1],調查所出現的字,最後再累計某一單字於此十五種出現的次數,作為選字的參考。
  • 常用字資料來源及其出現次數表:從「總字表」出現次較多之字挑選出7980字,結合「常用字表」,並合併「國民學校常用字彙表」[註 3]之字頻統計。
  • 國民常用字調查表:以「常用字資料來源及其出現次數表」選定之7980字為基礎,將「常用字表」與「國民學校常用字彙表」二者出現次的總和作為總出現次。依出現總次的高低排序,合併正俗字,選出其中最常用的4708字製成,此為初步統計結果。1978年(民國67年)教育部參酌各方意見將字表增訂至4808字,定名為《常用國字標準字體表》。

次常用國字標準字體表(乙表)

編纂團隊繼續研訂出次常用國字10740字。在參酌各方意見後,依使用頻率,區分為《次常用國字標準字體表》(乙表)6341字(含單位詞9字)以及《罕用字體表》(丙表)4399字。甲、乙、丙三表之異體字,則另立《異體字表》(丁表)來收納,以便檢索查找[4]

乙表的選字原則為:

罕用國字標準字體表(丙表)

編纂團隊研議擴充《罕用字體表》,丙表從原本的4399字增加為18388字(若含附錄字18字、補遺74字,則為18480字)[4]

《丙表》擴充之收字審定原則為:

  • 凡具有獨立音義,不屬於甲乙兩表之異體字者。
  • 若為一字多體,以合於六書、出現時代較早或筆劃較不繁瑣者優先。
  • 凡屬姓氏、化學元素名、地名、水名等專有名詞,雖為他字之異體字,然以專有名詞不能兩通,故皆獨立為罕用正字。
  • 複音詞聯綿字,兩字並收,如:誩、𠮳𠮴。
  • 凡音義不全或構形難解之訛字,概不收入。

字元編碼及字體電腦化

1980至1987年間,由中研院中美科學學術合作委員會與文建會(後升格為文化部)贊助的「資訊應用國字整理小組」發布《中文資訊交換碼》,納編53,940個漢字,包括:正體常用字4,808、正體備用字17,032、異體常用備用字11,517和正體罕用字20,583[11]。正體常用字即為《常用國字標準字體表》的4,808字[12]

1986年,中央標準局公佈《通用漢字標準交換碼》(後更名為《中文標準交換碼》)納編「常用及次常用字」,共計13,051字,成為中文資訊處理交換碼納編字數的國家標準[1]。該標準的第一字面字集(5,401字)編入《常用國字標準字體表》及常見的「國中小教科書常用字」,第二字面字集(7,650字)編入《次常用國字標準字體表》及使用頻率較高的「罕用國字」[13]。《中文標準交換碼》日後陸續擴編,目前大約有96,600多個漢字[14][15]。繁體中文資訊處理編碼業界標準五大專案碼(BIG-5)則是以《通用漢字標準交換碼》的前身「常用字碼集」為藍本而設計,於1983年12月推出[16]

教育部在公開招標評比後,於1991年委託華康科技公司製作《常用字表》及《次常用字表》等體的電腦母稿。1993年6月,教育部公布了《國字標準字體楷書母稿》及《國字標準字體宋體母稿》。隔年,教育部發布其電子字型檔[1]。1998年公布《國字標準字體方體母稿》(方體指不含圓體的黑體)和《國字隸書母稿》。1999年公布《國字標準字體宋體母稿增補編》。

比較

中央標準局所公佈的《通用漢字標準交換碼》(後更名為《中文標準交換碼》,CNS11643)与1984年发布的业界事实标准五大碼 (Big5) 有些许共同之处:两者都使用國字標準字體表为基础,但是《中文標準交換碼》所定义的码位更符合國字標準字體表所选定的字形。國字標準字體表本身并未定义字形的码位,而是依赖于其他标准将字形赋予码位。

其中,五大碼与现在的《中文標準交換碼》有部分收字差异:

五大碼与《中文標準交換碼》(CNS11643)的差异[17]
國字 字表序號[18] CNS11643 Big5收录异体 備註
U+5F5E彞 A01266 1-7641 C255,U+5F5D彝
U+53C4叄 B00287 3-3455 五大碼未收录
U+564D噍 B00439 3-4B43 五大碼未收录
U+36B7㚷 B00635 3-2847 五大碼未收录
U+5B0E嬎 B00715 3-4B5F E955,U+5B14嬔 CNS11643 第二字面 2-565F 疑似誤收 U+5B14嬔 字,但是显示为无点的 U+5B0E嬎
U+5C14尔 B00760 3-223F 五大碼未收录
U+3BA3㮣 B01783 3-4167 五大碼未收录
U+7934礴 B03027 2-662B F2A1,U+7921礡 疑似 Unicode 統合時錯誤對應到統合漢字 U+7921礡 上
U+7DF5緵 B03452 3-4E2B EDDB,U+7E4C繌 CNS11643 第二字面 2-5E48 疑似誤收 U+7E4C繌 字
U+9638阸 B05531 4-2833 五大碼未收录
U+9C0C鰌 B05989 3-5D76 五大碼未收录

其他

2000年,教育部出版《國小學童常用字詞調查報告書》[19],該研究透過對學童常用讀物的字頻和詞頻統計,調查出當時國小學生常用的5,021字。該報告書後來編纂為《教育部常用字庫辭典》,成為教育部識字量測驗的資料庫來源。

2012年,中華文化總會推出中華語文知識庫,其「漢字源流彙編」收錄常用漢字3,000字,並依次列舉甲骨文金文 戰國文字小篆隸書楷書六種字體,說明漢字形體之演變[20]

2013年,教育部委託國家教育研究院推動「建置應用語料庫及標準體系」的華語文教育計畫。研究團隊召開多次學者專家的諮詢會議,又依據語料庫的統計成果並徵求資深華語文教師的意見,在2020年完成了「臺灣華語文能力基準」的訂定,作為非母語人士學習華語的能力指標及分級標準之憑據。該指標分為三等七級,其字表部份總計收錄3,100字[21]

2018年,國家教育研究院出版《九十九年常用語詞調查報告書》和《一○○至一○四年常用語詞調查報告書》,調查2010年至2015年採錄語料的字頻、詞頻,並和《常用國字標準字體表》加以比較。以2015年為例,其字頻表採集到5,289字,字頻10以上的字數為3,404字,而《常用國字標準字體表》未收錄但字頻達10以上之高頻字,共計117字。另外,在2010年至2015年各年度的字頻表中,字頻10以上的字數,介於3,269字至3,410字之間。與教育部《常用國字標準字體表》比較,每年均出現而未收錄於該表的高頻單字有21 個[22]

標準、課綱和華語考試

根據教育部在1994年委託執行的「我國失學國民脫盲識字標準及脫盲識字字彙之研究」,台灣一般成人日常生活所需之基本字彙為2,328字,基本字為1659字,次基本字為669字。凡解讀日常生活基本字彙之能力在 470 個字以下者,列為「不識字」;能認 870 個字以上,而未達 1,680 字者為「半識字」;能認 1,680 字,並具有書寫日常生活之簡單應用文字能力者為「識字者」,可視為脫離文盲。[23][24]

十二年國民基本教育課程綱要(108課綱)規定在第一學習階段(國小 1-2 年級)認識常用國字至少 1,000 字,使用 700 字。第二學習階段(國小 3-4 年級)認識常用國字至少 1,800 字,使用 1,200 字。第三學習階段(國小 5-6 年級)認識常用國字至少 2,700 字,使用 2,200 字。第四學習階段(國中 7-9 年級)認識國字至少 4,500 字,使用 3,500 字。

華語文能力測驗所參照的臺灣華語文能力基準,是為外國人學習華語所制定,規定基礎(1-3級)要瞭解246~801個漢字,進階(4-5級)要瞭解1300~1900個漢字,精熟(6-7級)要瞭解2500~3100個漢字。

註釋

  1. ^
    1. (總字):中文大辭典,中國文化研究所。
    2. (常用字):日本基本漢字,三省堂。國民學校常用字,國立編譯館。教育部常用漢字表,教育部。
    3. (字源):古代漢語,泰順書局。角川常用漢字字源,角川書局。甲骨文字集釋,中央研究院。金文正續編,聯貫出版社。
    4. (通行字):辭源,商務印書館。辭海,中華書局。國語辭典,商務印書館。形音義綜合大字典,正中書局。王雲五綜合詞典,商務印書館。辭彙,文化圖書公司。最新漢英辭典,遠東圖書公司。
  2. ^
    1. 國民中學國文、歷史、地理、生物、公民等各擇一課為樣本,選樣原則以專業名詞出現最少之課文為主。
    2. 高級中學國文、歷史、地理三種課本各抽一篇或一章為樣本,原則如上。
    3. 中央日報》、《聯合報》、《國語日報》分擇國際版、社會版、副刊、廣告各一版為樣本。
    4. 兒童月刊》、《中華雜誌》、《讀者文摘》、《香港時報》,各取其中一篇為樣本。
  3. ^ 國立編譯館於1967年出版《國民學校常用字彙研究》(師範大學教育心理系黃堅厚教授主持此項研究)列入常用字3861字,次常用字574字,備用字429字,合計4864字。該書是根據國語日報、國民學校課本、兒童作品、課外讀物、廣播資料、民眾讀物等資料研訂出的國民教育基礎用字[8][9][10]

參考文獻

  1. ^ 1.0 1.1 1.2 1.3 1.4 曾榮汾. 教育部標準字體研訂的概況簡介 (PDF). 辭典學論文集. 文字學學術研討會. 1994 [2021-05-14]. (原始内容存档 (PDF)于2021-05-07). 
  2. ^ * 曾榮汾 & al., 國字標準字體(教師手冊)页面存档备份,存于互联网档案馆),中華民國教育部,ISBN 957-00-4240-0
  3. ^ 次常用國字標準字體表. [2021-05-14]. (原始内容存档于2021-05-14). 其中有5字不可考(幽靈漢字)。在目前教育部異體字字典的附錄中,已被改收至〈待考正字表〉。另有9字為單位符號,改收至〈單位詞參考表〉。扣除這14字後,共6,329字 
  4. ^ 4.0 4.1 4.2 4.3 李添富. 《異體字字典》的應用與未來. 東洋學. 2018, 71 [2021-05-14]. (原始内容存档于2021-05-14). 
  5. ^ 巫俊勳. 《異體字字典》未收字研究 ─以《字彙》為範圍 (PDF). 政大中文學報. 2019, 32: 315–358. 
  6. ^ 李添富. 《異體字字 典》正字選錄原則 (PDF). 世界漢字學會第四屆年會“表意文字體系與漢字學科建設”國際學術研討會. 2016-06-24~2016-06-28. 
  7. ^ 世界華文教育協進會. 第1屆世界華文教學研討會論文集. 世界華文出版社. 1985: 614-614 [2021-05-14]. (原始内容存档于2021-05-14). 常用字的選字即以中文大辭典編纂處的「總字表」(四九九O五字),委員會研訂之「常用字表」(二四O八字),及教育部「國民學校常用字彙表」(四八六四字),合併統計其總出現次數,於民國六十四年九月十五日正式完成「國民常用字表」 
  8. ^ 國家教育研究院. 九十九年常用語詞調查報告書. 元照. 2018 [2021-05-14]. (原始内容存档于2021-05-14). 
  9. ^ 林佑玫. 國小國語教科書生字序列研究 (PDF). 國立臺中教育大學語文教育研究所. 2010 [2021-05-15]. (原始内容存档 (PDF)于2021-05-15). 
  10. ^ 黃沛榮. 海峽兩岸整理文字的現況與省思. 華文世界. 1991, 62: 18–26. 
  11. ^ 曾世熊. 中文資訊交換碼 Chinese Character Code for Information Interchange,簡稱CCCII. 圖書館學與資訊科學大辭典. [2022-12-22]. (原始内容存档于2022-12-18). 
  12. ^ 中央研究院資訊科學研究所 20 週年慶特刊 謝清俊先生之簡介與訪談簡要. [2022-12-22]. (原始内容存档于2020-10-20). 
  13. ^ 認識全字庫- 中文碼介紹- CNS11643 中文全字庫. [2021-05-14]. (原始内容存档于2021-05-14). 
  14. ^ 全字庫現況. [2022-12-22]. (原始内容存档于2023-01-27). 
  15. ^ 全字庫中文標準交換碼 - 中文碼現況. [2022-12-22]. (原始内容存档于2022-12-17). 現有字數:現行全字庫中,戶政與地政部分用字經檢查為認同字,因而刪除該碼位資料,但仍保留該碼位的位置,現有字數即去除這些被認同掉的字碼,所計算得到的總字數……全字庫第八字面和第九字面所儲存的是拼音文字,所以沒有注音、倉頡等屬性資料碼位個數 
  16. ^ 行政院主計資訊處. 102 與文字共舞___中文數位化發展簡介. [2023-09-04]. (原始内容存档于2023-09-04). 
  17. ^ 次常用國字標準字體表 - 字嗨!. zi-hi.com. [2023-04-25]. (原始内容存档于2021-05-14). 
  18. ^ 国家教育研究院. 教育部异体字字典. [2021-05-14]. (原始内容存档于2021-05-15) (中文(臺灣)). 
  19. ^ 國小學童常用字詞調查報告書. [2021-05-20]. (原始内容存档于2021-05-20). 
  20. ^ 中華語文知識庫 - 漢字源流. [2022-02-21]. (原始内容存档于2022-05-17). 
  21. ^ 遣辭用「據」-臺灣華語文能力第一套標準 (PDF). 國家教育研究院. 2020 [2021-05-20]. (原始内容存档 (PDF)于2021-06-25). 
  22. ^ 《一○○至一○四年常用語詞調查報告書》(下). [2023-12-16]. (原始内容存档于2023-12-16). 
  23. ^ 我國失學國民脫盲識字標準及脫盲識字字彙之研究. [2023-12-16]. (原始内容存档于2023-12-16). 
  24. ^ 黃富順. 我國失學國民脫盲識字標準及脫盲識字字彙之研究 (PDF). 成人教育. [2023-12-16]. (原始内容存档 (PDF)于2023-12-16). 

參見

外部連結

字表

筆順

其他