Mizumoto, A., Yasuda, S., & Tamura, Y. (2024). Identifying ChatGPT-generated texts in EFL students’ writing: Through comparative analysis of linguistic fingerprints. Applied Corpus Linguistics, 4, 100106. https://doi.org/10.1016/j.acorp.2024.100106
Open Access にするのに 18 万円かかりましたが、この程度であれば研究費で何とか賄うことができました。同じ Elsevier でも System はインパクト・ファクターが高いため、Open Access にする費用も 50 万円以上かかります。Open Science が重視される時代に、いつまで Article Processing Charge (APC) を支払い続けるのだろうと思いつつも、商業的な仕組みに依存せざるを得ない現状…

Applied Corpus Linguistics は相変わらず turnaround time(査読プロセス全体にかかる時間)が速く、2 か月で出版できました。

以下はChatGPTによる論文の要点のまとめです。
論文の要点まとめ
研究の背景と目的
生成AI(Generative AI, GenAI)、特にChatGPTの登場により、英語を外国語(EFL)として学ぶ学生のライティング教育に新たな課題が生じている。本研究は、日本のEFL学習者が執筆したエッセイとChatGPTが生成したエッセイを比較し、両者の言語的特徴を分析することで、AI生成テキストの識別可能性を検証することを目的とする。
研究方法
- 参加者: 日本の大学1年生140名
- データ:
- 125名が独自にエッセイを執筆
- 13名がChatGPTを校正に使用
- 2名がChatGPTに全文執筆を依頼
- 追加でChatGPTによる123のエッセイを生成し、比較用データセットを作成
- 分析: 自然言語処理(NLP)技術を用いて言語的特徴を抽出し、機械学習(ランダムフォレスト分類)による識別を実施
- 評価項目: 語彙の多様性、統語的複雑性、名詞化、助動詞、認識的マーカー、談話マーカー、正確性、流暢さ
結果
-
人間のエッセイとChatGPTのエッセイには明確な違いがある
- ChatGPTのエッセイは語彙の多様性が高く、統語的に複雑で、名詞化が多い
- 人間のエッセイは助動詞や認識的マーカー、談話マーカーをより多く使用
- ChatGPTのエッセイは文法的エラーが極めて少なく、単語数が多い
-
NLP技術を用いた機械学習モデルは、ChatGPT生成テキストを高精度で識別可能
- ランダムフォレスト分類モデルによる識別精度は100%(一部指標を除いても97.8%)
-
ChatGPTを部分的に使用したエッセイの特徴
- ChatGPTを校正に使用した場合、統語的には人間のエッセイと類似するが、誤りがほぼゼロに近い
- 特に、エラー数の少なさがAI使用の重要な指標となる
結論と教育的示唆
- AIの適切な使用ガイドラインの整備が必要
- AIの倫理的使用に関する明確なルールを学生と共有することが重要
- ライティング教育への統合方法の検討
- AIを活用した適切な学習方法(例: 推敲の補助、フィードバックの活用)を促進
- 学生がAIに過度に依存せず、主体的に執筆スキルを向上させる仕組みが必要
- ライティング評価基準の再考
- AIを活用したライティングの評価方法を見直し、学習者の思考プロセスを重視する評価へシフトすることが求められる
本研究は、EFLライティング教育におけるChatGPTの影響を明らかにし、今後の教育方針やAI活用の指針を示す重要な知見を提供している。
Summary in English
Background and Objective
The emergence of Generative AI (GenAI), particularly ChatGPT, has introduced new challenges in teaching writing to English as a Foreign Language (EFL) learners. This study investigates the distinguishability of essays written by Japanese EFL learners compared to those generated by ChatGPT. By analyzing linguistic features, the research aims to determine whether AI-generated texts can be identified and how ChatGPT influences student writing.
Methodology
- Participants: 140 first-year university students in Japan
- Data Collection:
- 125 students wrote essays independently
- 13 students used ChatGPT for proofreading
- 2 students had ChatGPT write the entire essay
- An additional 123 essays were generated by ChatGPT for comparison
- Analysis: Natural Language Processing (NLP) techniques were used to extract linguistic features, and machine learning (random forest classification) was applied to differentiate human-written and AI-generated essays.
- Evaluation Metrics: Lexical diversity, syntactic complexity, nominalization, modals, epistemic markers, discourse markers, accuracy, and fluency.
Findings
-
Clear distinctions between human-written and AI-generated essays
- ChatGPT-generated essays exhibited higher lexical diversity, greater syntactic complexity, and more nominalization.
- Human-written essays contained more modals, epistemic markers, and discourse markers.
- ChatGPT-generated texts had significantly fewer grammatical errors and a higher word count.
-
NLP-based machine learning models can effectively identify ChatGPT-generated texts
- The random forest classification model achieved 100% accuracy in distinguishing AI-generated essays (97.8% accuracy even when some linguistic features were excluded).
-
Characteristics of essays with partial ChatGPT use
- Essays edited with ChatGPT retained human-like syntactic patterns but had significantly fewer errors.
- Error-free writing was a key indicator of ChatGPT-assisted revisions.
Conclusions and Educational Implications
- Need for clear guidelines on AI usage
- Institutions should establish ethical policies for AI use and communicate them to students.
- Integration of AI into writing education
- AI can be beneficial for brainstorming and revision but should not replace the cognitive writing process.
- Strategies should be implemented to ensure students use AI as a learning tool rather than a substitute for writing skills.
- Reevaluation of writing assessment criteria
- Educators should reconsider assessment methods to focus on students’ thought processes and engagement rather than just the final product.
This study highlights the impact of ChatGPT on EFL writing education, providing valuable insights into AI detection and responsible AI integration in academic settings.