【學苑新聞】校方三星期前(8月3日)召開記者會,公佈校方就生成式人工智能工具(GenAI)之新政策和實施細節,並指同學每月限20指令。校方今發電郵向學生公佈相關細節,並將使用上限改為以詞元(token)量度,同學每人每月有500,000詞元限額。
校方於電郵表示,9月1日開始,學生將可使用文字生成程式 ChatGPT 3.5 及圖像生成程式 DALL·E 2,每個查詢主題可使用20條指令,查詢次數不限,惟每人每月有500,000詞元的限額。根據 OpenAI 網站,一至兩句的英文文本約等於30詞元,1,500字的英文文本則約等於2,048詞元 [1]。校方另指,涉及圖片的運算會使用更多詞元。
語言模型在處理文本時,會將其分詞(tokenization),即將文本分割作不同詞元(token) [2],而詞元通常為最小的意義單位。OpenAI 亦有提供工具以查詢文本的分詞結果 [3]。
本報正向港大傳訊及公共事務處查詢同學可否查看自己每月所剩詞元限額。
注:
[1]:https://help.openai.com/en/articles/4936856-what-are-tokens-and-how-to-count-them#h_63fd902129
[2]:https://platform.openai.com/docs/introduction/tokens
[3]:https://platform.openai.com/tokenizer