Blind Model Evaluation

金融專業回答盲測

親愛的受試者您好:

感謝您參與本研究之金融專業回答盲測。本研究旨在了解不同大型語言模型在金融問答情境中的回答品質,並透過受試者盲測評估回答的正確性、金融推理、完整性與可讀性。

本問卷將請您輸入金融相關問題,系統會針對每一題顯示三個匿名回答 A / B / C。

  1. 比較三個回答中整體最好與整體最差的回答。
  2. 依金融正確性、金融推理、完整性與可讀性選出各面向較佳的回答。
  3. 簡短說明您的選擇理由與觀察。

您的回饋將協助本研究分析模型回答品質,以及受試者在金融問答評估時的判斷依據。本問卷包含選擇題與開放式文字回覆,歡迎您依照自身經驗與專業判斷提供真實意見。

您的回答將會保密處理,並僅用於本學術研究之量化比較與質性分析。感謝您撥冗參與本研究並提供寶貴意見。

Sincerely,

駱泳誌

國立政治大學 資訊管理系 碩士生

指導教授:蔡瑞煌博士

Thesis Title: The Augmentative Residual Adapter Approach to Pre-training