之前出了一篇英英字典的介紹
現在終於要來寫這個系列的第二篇了!!!! (整個拖稿嚴重 XD
如果還沒看過英英字典的介紹
文章目錄
什麼是語料庫
今天的主角是語料庫Corpus
在開始介紹前
先來解釋一下什麼是語料庫(Corpus)
根據網路上的定義 他這麼說
It refers to large collections of texts which represent a sample of a particular variety or use of languages
that are presented in machine readable form.
凱蒂幫你翻成超級白話文的意思是
他是一大堆文字所組成的巨大資料庫
可以顯示語言的特定或不同用法
平常會用語料庫的人,比較多是研究語言學的人
語料庫可以看出一個字的使用頻率、用在哪、前後搭配的東西等等
為什麼你需要用語料庫
我知道這樣聽完 沒用過的人應該還是一頭霧水
而且會想說 我又不是要研究語言學 語料庫對我來說有什麼用
讓我來告訴你 以一個英文學習者而言哪時候用的到語料庫
1. 想確認有沒有這樣的講法 像是會有人說look of me嗎
2. 不確定這幾個字的排序 是see beautiful something 還是see something beautiful
3. 想知道這幾個字中間應該放什麼 像是look跟 me中間可以或是應該要放什麼
4. 哪樣子的寫法才是常見會有人講的 是beautiful big eyes還是 big beautiful eyes
5. 想知道特定字會搭配什麼字做使用(類似搭配詞字典的用法) 像是ocean可以用什麼字形容
6. 相似的意思的字分別用在什麼地方 像是smile, laugh, grin, smirk…
看到這邊
有沒有覺得你好像也需要用一下語料庫阿 XDD
推薦的語料庫
今天跟大家推薦的語料庫有3個
- Netspeak
- Liggle10^12
- Google Search
基本上我自己是看需求搭配輪流使用
沒有特定都用哪一個
這三個是我覺得比較屬於一般大眾都可以簡單上手的語料庫
當然還有一些功能更複雜資料量更大的語料庫
但是那對一般的學習者而言 並不是那麼好用
接下來會一一介紹什麼時候可以用哪一個語料庫~~
Netspeak
Netspeak這個語料庫走一個極簡風格
一打開便可以看到他提供的五種查詢功能
然後就沒有其他東西了
超乾淨的頁面 XD
五種查詢功能分別是
1. 問號:? 找一個字 打??就是找兩個字,打???就是找三個字,以此類推
2. 刪節號:… 找一個以上的字,但不限定幾個字
3. 中括號:[ ] 比較哪個用法常見
4. 井字號:# 找相似意思的字
5. 大括號:{ } 找哪一種排序方式比較常見
最右下角 >> 的符號點下去
會有更詳細的介紹怎麼使用
好~
現在我們來舉例子
1. 問號:? 找一個字,打??就是找兩個字,打???就是找三個字,以此類推
像這樣你可以看到look跟me中間 會放那些字詞
不過語料庫的功能
只能顯示說 在他的語料庫中
有多少比例的資料是這樣的用法
並沒有辦法告訴使用者這些用法的意思
意思就還是要去查一般的字典囉
如果你把那個+按下去
可以看到這樣子的用法在真實語境中的運用
只是呢~ 我發現netspeak好像有很多的例子都是來自歌詞
像是報章雜誌的語境例子就比較少
這部分呢
只能說 他告訴你有人這樣使用英文
但是是不是比較正式的用法也可以這樣用呢
這部分就要讓使用者自己評估了
如果我們今天打兩個問號 ? ?
則可以看到look 跟 me 中間如果夾兩個字
會有什麼樣的選項
2. 刪節號:… 找一個以上的字 但不限定幾個字
如果今天你沒有特定只找夾特定字數的字個字
可以試試看用刪節號…
3. 中括號:[ ] 比較哪個用法常見
你可以發現比較多人會說eat slowly 而不是eat slow
圖片上slowly那個字為什麼被chrome畫紅線 我也不知道 XDD
4. 井字號:# 找相似意思的字
在你要找的字前面加上#
Netspeak就會給你相似意思的字
只是它顯示的這些字 意思有多相近
到底這些字分別是什麼意思
還是要再跟字典確認哦
不過如果要找同義字
比較建議使用同義字字典
也可以這樣子尋找
5. 大括號:{ } 找哪一種排序方式比較常見
有時候在寫作時
你可能不確定這幾個字的排序應該怎麼排才是對的
也可以借助語料庫的幫忙
像是 照顧的英文是take care of 後面加上要照顧的人
只是如果你不確定 這幾個字到底怎麼排
可以使用大括號
或是像有時候很多個形容詞要排序
你不確定時也可以用這個功能
像是中文會說 美麗的大眼睛
可是英文也是一樣嗎?
以上是有關Netspeak的介紹~~
Linggle10^12
Linggle10^12 這個語料庫
點開之後便是說明的頁面
他是中文的說明 所以大家在理解上應該不會有什麼問題
他的說明很詳細
如果不懂 還可以點綠色的guide
他有一步一步的教學
簡單的介紹一下它的功能
他跟Netspeak一樣 有不同的查詢功能
分別是
1. 底線:_ 找一個字 打_ _就是找兩個字 打_ _ _就是找三個字 以此類推 (同Netspeak的?)
2. 星號:* 找一個以上的字 但不限定幾個字 (同Netspeak的…)
3. 斜線:/ 比較哪個用法常見 (同Netspeak的[ ])
4. 問號:? 確認是否需要某個字在那裏
5. 用詞性(Part of Speech)詢問:v./ n./ adj./ prep./ det./ conj./ pron. 要注意要打縮寫點
官網給的小教學如下
不過基本上網站直接點開 就有很詳細的說明跟教學了
Linggle10^12跟Netspeak最大的差別
就差在可以用詞性做查詢
這個是我很喜歡的地方
有點類似查詢搭配詞的用法
在此做幾個示範
其他功能因為跟Netspeak相似
所以就不多做介紹
如果有需要的可以參考他網站上有很詳細的教學
像是如果我們今天想要知道 space(n. 空間)這個字前面常會搭配什麼形容詞
就可以這樣搜尋 在space前面打上adj.
或是如果我今天想知道look的後面可以放什麼介係詞
可以在look的後面打上prep.
搜尋結果的右邊 有綠色的show按鈕
點下去可以看這個用法的例子
但是!!!!!!
根據網站的說法(2017年) 這個功能還沒有都弄好
我隨機試了幾個字
有一些結果是可以的
有一些結果會不太一樣
所以在使用上可能要注意一下
像這個就算是很清楚的點出look for在句子裡的位置跟用法
但是這個就沒有了~~
不過基本上Linggle10^12
算是介面直觀也清楚
我個人蠻喜歡的
Google Search
最後一個要來介紹的應該是大家每天都在用的Google搜尋引擎
他其實才是我最最常用的語料庫 XD
但是我用它的功能
就是確認有沒有這樣的說法
就這樣而已
他並沒有辦法像前面兩個語料庫有這麼多詳細的功能
Google搜尋引擎 是一個很大的資料庫平台
所以你可以利用大家寫出的東西
去判斷這樣子的用法 有沒有人用
或是哪樣子的說法比較常見
我們舉個例子來說明
假設我今天想要知道
到底一般會說 warm and cozy 還是cozy and warm 又或是都可以
我們就把這兩個選項都打到Google上
打上warm and cozy可以發現 幾乎大家都是這樣用
所以可以確定應該就是這樣沒錯
接下來只要反過來打 看看結果就可以確定囉
反過來 cozy and warm的結果
你可以發現 看到的還是warm and cozy
所以一般會說的就是warm and cozy囉
另外…. 因為我現在在泰國好一陣子了 所以查出來有一點多泰文
大家就見諒囉 XDD
如果你不確定自己查的結果到底對不對
你可以往下看多一點搜尋結果
把第一頁看完就可以了
那有一些狀況會是 兩種都有查到
那就是兩種用法都可以囉
這時候可以看查到的結果數量
比較多的一般就是代表比較常用囉
再來一個例子
假設今天你不確定是要講chase my dream還是chase after my dream
你可以把兩種說法都丟到Google上
先看到chase my dream 基本上看起來沒麼問題
再來看chase after my dream
你會發現Google查到的after 都不是跟在chase後面做使用
所以代表不是這樣用的
如果你自己用英文寫了一句話
不確定到底有沒有這樣的講法
最快的做法就是丟Google 看看有沒有人這樣用囉
結語
語料庫 在寫作上可說是讓你遠離中式英文的好幫手之一
很多時候你可以寫出來的東西
拿給朋友看 大家都看得懂
因為我們都是以中文為母語的人
我們直接把你的英文翻成中文 是可以懂的
但是是不是有時候會有人跟你說
“對阿 你寫的英文我看得懂 可是就不知道哪裡怪怪的”
這個怪怪的地方
就可以靠語料庫以及搭配詞字典的幫忙來解決囉!
搭配詞字典的話~~ 我們就下集待續囉!!