略過導覽

R.A.S

適讀性線上分析系統簡介

什麼是適讀性

  「適讀性」主要是在探究文章的「適合閱讀年齡」或「適合閱讀年級」,而早期的研究以「可讀性」作稱呼,探討的是文章的「相對難易度」。

  適讀性源自於英文Readability,它代表了文章的可辨讀性(Legible)、易讀性(Easy to read)或引起讀者的興趣(Because interesting)等,分為三個層面進行探討:可辨讀性主是在探討印刷品本身的各種因素,找出最適合讀者閱讀的狀態;易讀性則在找出文章易讀、難讀的因素,這部份的研究是針對讀者對於讀物內容的了解或理解所進行的,此研究方向延伸出適讀性預測公式的發展;而第三類有關研究讀者的興趣與閱讀之間的關係,則是以心理學、教育學等角度,探討讀者的內在心理因素。

  本系統所探討的適讀性,則為可讀性的層面。最主要的功能就是讓使用者透過網站介面的操作,由系統針對使用者提供的文章進行內容分析,在分析結束之後,顯示此文章的「適讀年級」,讓使用者了解此文章若要用於教學,會較適合用於哪一個年級的學童。

適讀性的相關研究

  適讀性(可讀性)的相關學術研究,英文文章的適讀性研究在國外很早就出現。適讀性的研究進行方向,又區分為量度(Measuring)及預測(Predicting)兩類。量度是以判斷或測驗進行,必須涉及讀者;而預測則是以公式(Formula)進行,不涉及讀者,是以語文中的各類因素進行計算,求出預測值來決定該語文的適讀程度。底下簡要列舉英文適讀性的研究歷史:

      
  • 1921年,Thorndike的Teacher’s Word Book提出了常用字的概念。
  • 1923年,Lively與Pressey正式探討書本難讀的相關因素。
  • 1925年,McCall Crabbs發展了閱讀標準測驗(Standard Test Lesson in Reading),提供後續預測公式作為難易度的客觀指標。
  • 1928年,Vogel與Washburne開發了判斷公式,用來推估出版品的適讀年級。
  • 1934年,Dale與Taylor,以成人為對象,發展出可用於成人的適讀預測公式。
  • 1935年,Gray與Leary以問卷方式收集了出版商、圖書館員、教師及一般成人讀者的意見,進行大量的影響可讀性因素研究,並發展出其預測公式。
  • 1939年、1944年,Lorge參考了McCall Crabbs的閱讀標準測驗值為難易度數據,發展出較現代化且使用簡便的預測公式。
  • 1948年,Flesh於1943年認為成人讀物的影響因素,能由抽象觀念的多寡來決定,而發展出較適用於成人的預測公式,其後修正了公式中較不易計算的部份,提出了修正公式 Reading Ease Formula及Human Interest Formula。
  • 1950年,Flesh提出另一個較為繁複的新公式,用於量度抽象概念的層次。
  • 1951年,Farr、Jenkins與Paterson三人修正了Flesh的Reading Ease Formula,使公式在使用上更為方便。
  • 1953年,Taylor設計了填空檢驗程序(Cloze Procedure),即現今常用的克漏字測驗(Cloze Test)。
  • 1961年,Smith發表了Devereaux Formula,以字元空間(Character-Spaces)為新變項來計算用字難度。
  • 1961年,Jacobson為高中化學及物理教材開發了兩個適讀性公式,這二個公式也可用在大學層次。
  • 1962年,Rogers針對聽力設計了預測公式。
  • 1965年,Coleman發展出四個一般用途的適讀性預測公式。
  • 1969年,Bormuth針對自小學一年級至大學程度的各類文章,以填空檢驗程序及兩千多位四年級至十二年級的學生進行研究,嘗試了一百多個變項,得到二十四個公式。並在1975年為教師的使用便利提供了較簡易的公式。
  • 1975年,Coleman與Liau發表了與Bormuth類似的公式。
  • 1976年,Liau、Bassin、Martin與Coleman修正了Coleman早期的公式,選擇了四個測度容易的公式。
  • 1982年,Harris與Jacobson發表了能用於一至八年級,並可擴充至十一年級的公式。

  在英文適讀性預測公式的部份,典型的公式多採用計算「文句長度」及「用字難度」二項,這對於中文在適讀性預測公式的研究上給予了很好的啟發。

  中文適讀性的研究,早期稱為「可讀性」研究,相關的研究有:

  • 1955年,艾偉的漢字問題一書談論到中文適讀性的因素。
  • 1960年,于宗先,應用Flesh的公式發表了「臺灣報紙可讀性之研究」,是最先以英文適讀公式應用於中文適讀分析的首例。
  • 1971年,楊孝濚以八十五篇現代中文文章,研究中文適讀性預測公式,發表了「影響中文可讀性語文因素的分析」;其計算結果為相對的難易值,尚無法推論至適讀的年級或年齡。
  • 1976年,陳世敏的「中文可讀性公式試擬」提出了可計算出適讀年級值的公式,但此公式可應用的效度太低。
  • 1992年,荊溪昱的「國小國語教材的課文長度、平均句長、及常用字比率與年級關係之探討」研究計畫,以國小六個年級的國語課本為範圍,發展出具實用性的中文預測公式;並於1994年的「中學國文教材的適讀性(Readability)研究」,將公式擴展至中學(國中及高中)的國語文教材。其中,在國小國語教材的適讀性研究中,已經證實了「課文長度、平均句長、常用字比率與不同文體」之組合,可以有效的推估出適讀年級值,這些因素與適讀年級值的相關係數達0.9,進而在之後延伸至國中、高中國語教材的研究中,將適讀性預測公式的適用範圍推廣到高中部份。

  本系統所採用的中文適讀性預測公式,即為荊溪昱博士在「中學國文教材的適讀性(Readability)研究」所提出的公式。

  適讀性預測公式的相關說明在底下還有詳細的介紹。

線上分析系統能為你做什麼

老師及家長:

  能夠瞭解網路上的中文文章(或電腦檔案)能適用在哪一個年級的學童,難度過高的文章對於學童的學習會有負面的影響,提供一份難易適中的教材,才能讓學童有效的進行學習。

  對於老師來說,教材中的各章節內容的適讀年級值,可作為教科書挑選或教科書內容調整的一項參考指標。

研究人員:

  本系統提供了相關的研究輔助機制,能延伸本系統的功能至相關的適讀性研究中,譬如:簡體中文的教材適讀性、一般兒童讀物的適讀性、其他科別教科書的適讀性等等。

適讀性預測公式介紹

適讀年級值(Y) = 8.76105604 
                      +0.00272438 * 課文長度(X1) 
                      +0.07866782 * 平均句長(X2) 
                      -8.94311010 * 常用字比率(X3) 
                      +0.42920182 * 詩歌文體(X4) 
                      +3.23677141 * 文言文體(X5)

  

  其中,Y為適讀年級,其值從1至12以上。常用字比率的部份,在常用字的判定上,是以國小495常用字表為依據;至於文章體裁中尚有一項「對白文體」,由於在國、高中國文教材中已失去預測之效用,故僅於下方的名詞界定中陳述其定義,但並沒有納入適讀年級值的計算當中。

名詞界定

中文文章:

  指的是以「繁體中文」為主體的文章,文章內容中的標點符號、特殊文字以及其他語系的文章(含簡體中文),系統會自動忽略這些文章;適讀性預測公式截至目前為止,還無法同時探討含有二種以上語系文字的適讀性。至於標點符號,有一部份與「句子」的判斷有關,請繼續參考下方的名詞界定說明。

課文長度:

  指的是不包含「課文標題或文章標題」以及「標點符號」的中文總字數。因此,若要得到較精確的適讀年級值,請記得將課文或文章的標題刪除之後,再進行分析的動作。

平均句長:

  指的是上述的課文長度,除以「完整句」所得的平均字數;所謂的完整句,是以逗號、句號以及驚嘆號作結束的文句。備註:上述用作完整句切割的標點符號有「,,。..!!」七個。

常用字比率

  指的是中文常用字,除以課文長度所得的比率;常用字的判斷,是以國小495常用字表為基準。備註:「中學國文教材的適讀性(Readability)研究」曾對國小495常用字表及國高中765常用字表進行研究,研究結果顯示國小495常用字表較佳,因此,延伸至國高中的預測公式依然使用國小495常用字表。

詩歌文體

  包含了文言文的詩、詞、歌、賦,以及白話文的詩、歌等的文章體裁。

對白文體

  文言文或白話文中,以「對話」方式為內容主體的文章體裁。

文言文體

  所有以文言文記述的文章體裁。備註:文言文的詩、詞、歌、賦,需要同時勾選「文言文體」及「詩歌文體」二項,若是文言文的對白文,則同時勾選「文言文體」及「對白文體」。

進行適讀性分析時的重要事項

  1. 內容裡不應包含「標題」
  2. 檢查標點符號的使用是否正確,尤其是文言文詩詞。
  3. 文章體裁的選項是不是都勾選了,尤其是「文言文體 詩歌文體」或「文言文體 對白文體」兩種。

適讀性分析的限制

  1. 由前述介紹的名詞界定中可以得知,本系統對於內容含有特殊文字或其他語系文字的文章,會以忽略這些文字的方式進行分析,因此,所得到的適讀年級值可能與實際情況會有所落差,使用者以本系統進行適讀性分析時,必須自行留意此部份。
  2. 適讀年級值,並不是反向地要求文章應該修改內容來符合適讀的條件,而是說明此文章能夠應用在什麼年級的學童上,同時,針對教科書而言,文章的適讀或易讀,只是其中一項的指標而已,教育人員仍必須考量其他的指標來評鑑教科書的良莠與否,不能單憑適讀年級值做為挑選教科書或教材。

參考資料:

荊溪昱(1994)。中學國文教材的適讀性(Readability)研究。國科會研究計畫:NSC82-0301-H-017-009。

國小495常用字表

  表格中的常用字是以「文字 該文字的字頻」單位進行顯示,並按字頻高低進行排列。此國小常用字的分析資料範圍為國小統編版的國語課本,與教育部另一個國小學童常用字詞略有不同。

的  3744一  1773了  1522我  1396是  1224
不  1080有  1008他  980人  888來  850
在  817們  781說  732就  705到  700
這  638大  635上  625個  576看  569
天  546你  540子  530好  524小  516
要  503裡  454去  448著  440得  426
國  424家  413很  381以  375時  375
也  369都  359學  344爸  334媽  330
為  328下  327麼  323起  311和  305
過  300出  300生  298會  295多  291
把  281中  259水  257可  251後  249
地  248山  244又  240做  237成  235
樣  233事  230年  229自  226親  224
心  222那  219道  219候  219沒  219
用  217還  215高  214能  214想  214
對  213從  212知  204常  197面  197
回  194書  192花  188見  187老  185
然  182像  179頭  186什  174開  173
弟  172白  169才  169種  169方  167
如  163明  162母  159問  159長  158
聽  158王  157邊  156同  155快  155
發  154前  154走  154愛  153父  153
氣  152飛  151樹  150海  148月  146
聲  145經  145最  145話  143兩  143
十  143兒  142太  137色  135新  135
幾  134光  134給  134現  133美  131
只  129外  129力  129叫  125因  125
己  125帶  124但  124些  123三  123
手  122使  121吃  121再  120歡  120
真  120作  120日  119意  119路  118
進  118所  118笑  118定  113字  113
寫  112工  112她  112向  112師  112
跟  112先  111信  109風  109西  109
點  108動  107喜  107住  107每  106
條  105空  105打  102河  102實  102
呢  101情  101相  100亮  100別  99
片  99它  99隻  99東  98應  98
魚  98已  98果  97行  96正  95
次  93身  92星  91本  91孩  89
間  89臺  89分  88難  88樂  88
哥  87車  87公  87二  87變  86
電  86怎  86覺  86陽  85活  85
名  85更  85於  84而  84該  83
望  83等  83妹  82滿  82讓  80
處  80晚  79當  79遠  79比  79
筆  77答  77坐  77民  77原  76
讀  76木  76放  76四  75興  75
張  75理  75無  73許  73文  73
第  72秦  72容  72流  71唱  71
站  71船  71重  71拿  70歌  70
雨  70法  70客  69教  69全  69
立  68物  67少  67火  67安  66
代  66請  66接  66五  66金  65
哪  65功  65馬  64早  64清  64
收  63口  63紅  62位  62服  62
綠  61靜  61機  61神  61軍  61
友  61完  60合  60認  60告  60
節  59影  59主  59報  58城  58
畫  57非  57怕  57句  57忙  57
校  57幫  57造  57眼  57伯  55
直  55麗  55林  55表  55各  55
期  55跑  54球  54青  54吧  54
玉  54燈  54春  54利  54六  54
玩  54鳥  54石  54部  54此  54
加  53近  52古  52草  52且  52
嗎  52黃  52卻  51謝  51便  51
門  51平  51農  50詩  50術  50
送  50朋  50院  49座  49今  49
越  49強  49講  49百  49由  49
並  49被  48塊  48房  48管  48
音  47通  47故  47誰  47希  47
步  47狗  47趕  47苦  47建  47
目  46假  46北  46灣  46求  46
刻  46交  46識  46穿  45其  45
任  45久  45葉  45午  45受  45
橋  45失  44李  44夜  43習  43
萬  43雖  43找  43整  43遊  43
思  43深  43黑  43漸  42布  42
奇  42訴  42形  42土  42田  41
孔  41熱  41指  41您  41世  41
南  40往  40關  40場  40千  40
雄  40念  40或  40照  40江  39
內  39夠  39喝  39體  39衣  39
雲  38貓  38蓮  38留  38羊  38
傳  38視  38轉  38忽  37輕  37
朝  37之  37易  37感  36跳  36
屋  36課  36努  36特  36華  36
慢  36落  36景  36女  35飯  35
件  35射  35責  35臉  35界  35
曾  35肯  35共  35改  35切  34
反  34爬  34隨  34士  34低  34
數  34買  34離  34死  34停  34
演  34盡  34園  34趣  34首  34
齊  34野  33提  33班  33始  33
武  33鄉  33秋  33準  33記  33
顆  33姊  33乾  32精  32英  32
旅  32竹  32將  32羅  32敬  32
半  32結  32男  32拍  32史  32
紙  32淡  32洞  32勇  32鐵  32

本文最後編輯日期:2007/1/10