OpenAI の ChatGPT と「論文生成器」による研究論文不正について

先日、2022年11月30日に試験公開された OpenAI による対話型の応答システム ChatGPT の話題でやりとりをしている中で、AI によるプログラミングに話が及びました。

「プログラムが OpenAI であるかどうかを判定できるか?」と ChatGPT に聞いてみたところ、「おそらく、OpenAI の API を使用したプログラムを特定することは困難です。OpenAi の API は一般的なプログラミング言語やフレームワークを使用して・・・」といった「無難な」返事が返ってきました。質問は、「OpenAI の API によるプログラム作成システムによって生成されたプログラム」に関してというつもりでした。

そのときに、ふと、思い出したのが「論文生成器」のことでした。

5年ほど前に大学改革支援・学位授与機構で研究不正防止に関する責任者として研修を担当したときに、そのころに話題になっていたことが頭に浮かびました。この研修は教員だけでなく、機構の業務上でも重要なことですので大学評価や学位授与を担当する職員の方々も受けておられました。

添付の資料は研究活動における不正行為の防止について、研究費に関わる不正は別に扱うこととして、主として研究成果の公表に関わることを扱ったものです。この中で、「論文生成器」については pp.14-15 で扱っています。

2005 年に MIT の SCIgen という Computer Science の論文を自動生成するシステム (2002年) を使った nonsense 論文2編を国際会議に投稿してうち1編が “non-reviewed” paper として採択されたという話題が発端です。じつは、2014年に Springer と IEEE が 120本の論文を Proceedings から削除したということが話題になっていました。それを検出したのが Grenoble で開発された SCIgen Detection システムだったというのです。添付の資料には、実際、SCIgen で作成した “論文” のPDF ファイルを SCIgen Detection Site で与えてみた例をあげてあります。

このように、AI による nonsense 論文生成(とはいってももっともらしい体裁の文書)とそれの検出ツールが別に存在するというのではなく、論文の生成と検出がおなじ知識を持つようなことになれば、ChatGRT に「SCIgen で作った論文かどうかの判定する方法は?」と聞いたときの4つの答えの中の「SCIgen で生成された論文は、一般的にクオリティが低いため、他の論文と比較しても劣っていることが多いです。そのため、論文のクオリティや影響度などを評価する指標を用いて比較することができます。」ということに尽きるのでしょう。

しかし、一方で、添付資料 pp.6-7 でも扱っていますが、いわゆる”ハゲタカ出版社” (Predatory Publisher) での出版を研究業績と認めることがないような仕組みも必要でしょう。

なお、この資料は5年前の状況ですので状況が変わっていることもあると思います。

研究活動における不正行為の防止について

 

Implementation of Conflict-free Collaborative Data Sharing

CCDSAgent is an agent for Conflict-free Collaborative Data Sharing for distributed systems based on our published papers:

Through the implementation of the CCDSAgent, we made several findings in details which are not described in the paper, e.g., Operational Transformation and Concurrent synchronization.

Our implementation reveals the versatility of the CCDS approach:

  • The CCDSAgent does not use any locks for shared data nor has any chances of blocking in message passing.
  • Separation of peer’s application from synchronization of shared data would demonstrate our proposal of “Sharing-Oblivious” design for distributed systems.

 

CCDSAgent for Conflict-free Collaborative Data Sharing

5月16日の参議院院内集会で触れた「沖縄科学技術大学院大学」について

5月16日の参議院院内集会「国際卓越研究大学法案を廃案に! 緊急院内集会 ~大学における多様な学びの機会の保障を求めて~」(「国際卓越研究大学」法案について)で触れた沖縄科学技術大学院大学(OIST)の話題が出ていました。

「論文が世界9位となった『沖縄科学技術大学院大学』の可能性について」(2022-05-17)ニッポン放送
https://news.1242.com/article/361281

 

「国際卓越研究大学」法案について

2022年5月16 日の参議院院内集会

「国際卓越研究大学法案を廃案に! 緊急院内集会 ~大学における多様な学びの機会の保障を求めて~」

で「国際卓越大学は大学界の研究力を高めるか?」と題して意見を表明させていただきました(資料参照)。

集会のプログラムは以下の通りです。

プログラム:
国会議員の挨拶・メッセージ
報告1
「国際卓越研究大学法案の問題点」
米田俊彦(お茶の水女子大学教授、教育史学会代表理事)
報告2
「国際卓越大学は大学界の研究力を高めるか?」
武市正人(東京大学名誉教授、大学改革支援・学位授与機構名誉教授)
報告3 大学の教育・研究・医療の現場からの声
古川隆久(日本大学教授。ビデオメッセージでの参加)など
学生の意見(交渉中)

なお、主催者による会合の録画は https://youtu.be/WeW-fQb6F-U にあります。

報告2「国際卓越大学は大学界の研究力を高めるか?」の資料は以下にあります。

Technical Report – Operation-based Collaborative Data Sharing for Distributed Systems, Masato Takeichi. November 26, 2021.

Abstract:

Collaborative Data Sharing raises a fundamental issue in distributed systems. Several strategies have been proposed for making shared data consistent between peers in such a way that the shared part of their local data become equal.

Most of the proposals rely on state-based semantics. But this suffers from a lack of descriptiveness in conflict-free features of synchronization required for flexible network connections. Recent applications tend to use non-permanent connection with mobile devices or allow temporary breakaways from the system, for example.

To settle ourselves in conflict-free data sharing, we propose a novel scheme Operation-based Collaborative Data Sharing that enables conflict-free strategies for synchronization based on operational semantics.

TR-OCDS (Click to download)

Also available at https://arxiv.org/abs/2112.00288

Technical Report – Conflict-free Collaborative Set Sharing for Distributed Systems, Masato Takeichi. November 19, 2021.

Abstract:

Collaborative Data Sharing is widely noticed to be essential for distributed systems.
Among several proposed strategies, conflict-free techniques are considered useful for serverless concurrent systems.

They aim at making shared data be consistent between peers in such a way that their local data do not become equal at once, but they arrive at the same data eventually when no updates occur in any peer.

Although the  Conflict-free Replicated Data Type (CRDT) approach could be used in data sharing as well, it puts restrictions on available operations so as to concurrent updates never cause conflicts. Even for sets, popular operations such as insertion and deletion
are not freely used, for example.

We propose a novel scheme for  Conflict-free Collaborative Set Sharing that allows both insertion and deletion operations. It will provide a new synchronization method for data sharing and gives a fresh insight into designing conflict-free replicated data types. We might consider that this becomes a substitute for CRDTs.

TR-CCSS (Click to download)

Also available at https://arxiv.org/abs/2112.00286

我が国の科学者の過半数が「日本学術会議の任命拒否に対する抗議声明」に関わる

前回、2020/12/04 の投稿では、我が国の科学者の約半数が「日本学術会議の任命拒否に対する抗議声明」に関わっていると書きましたが、その後の学協会の声明を合わせると、過半数になりました。

これまでの情報に加えて、2020/12/24 の学術会議の記者会見資料にある学協会のデータ等を加えた結果です。2021/01/12 現在で以下のようになっています。

個別学協会数:  1,980、 総会員数(延べ)3,604,159 名

声明発出学協会数:  750 (37.9%)、 学協会会員数(延べ)  1,825,319 名 (50.6%)

声明を発出した学協会の情報が2次利用できるような形態ではないために集計に手間がかかるとともに確認がたいへんです。学協会の連合体で発出した場合や合同で声明を出している場合に個別の学協会にバラして、さらにはこれらに重複して現れている場合には重ねて集計することのないように処理を行っています。

我が国の科学者の約半数が「日本学術会議の任命拒否に対する抗議声明」に関わる

前回の投稿記事ー「日本学術会議の任命拒否に対する抗議声明」 人文・社会科学者の35%が」は11月中旬までの学協会の(うちで第一部人文・社会科学分野と思われるものの)情報を手作業で集計したものでした。

その記事の中で引用した我が国の学協会の現状の解説記事の執筆者の協力を得て、11月末までに抗議声明を発出した日本学術会議協力学術研究団体(協力学協会)の状況をあらためて集計しました。今回は全分野を対象としています。

個別学協会数:1,980、総会員数(延べ)3,604,159名

声明発出学協会数:718(36.3%)、学協会会員数(延べ)1,708,590名(47.4%)

延べ会員数の比率から直接的に声明に関与した科学者数を算出するわけにはいきませんが、87万人といわれる我が国の科学者の約半数が今回の会員任命拒否の抗議声明に関わっていると推察できるでしょう。

賛否が求められて任命拒否に反対したということではなく、学術界への政治の介入への危機の認識から学協会から自発的な行動として発せられたものです。その意味で、科学者の「半数」というのは大きな比率だといえるでしょう。まだ、行動をとっていない学協会にもこの動きを知っていただきたいものです。

抗議声明を出した学協会の中には、協力学協会に含まれていない団体もありますが、ここでは協力学協会のみを扱っています。また、大学団体等については含めていません。声明を出した学協会の一覧は学術会議の記者会見資料や Web 上で「学者の会」で公開されていますが、個別に発出することもあれば、連合体として、あるいは複数の団体が共同で発出することもあり、それによってこれらの一覧には重複が生じています。上はそれらの重複を除いて集計したものです。

協力学協会には「連合体」として個別学協会が集まったものも含まれます。抗議声明をこの連合体が出している場合もあります。ここではこれは構成している個別学協会にバラしています。基礎となるデータは2019年(一部、2020年)です。また、会員数は「個人会員」のみのデータです。科学者個人は複数の学協会の会員になるのが一般的ですので、会員数は重複を含む延べ数です。

「日本学術会議の任命拒否に対する抗議声明」 人文・社会科学者の35%が

2020年11月12日の日本学術会議の記者会見では梶田会長ら幹部が「会議が推薦した会員を任命されない事態は想定してない」と述べた。

この記者会見の際の資料にはこれまでに学術会議が把握した「日本学術会議に関する学協会・大学等の声明等一覧(令和 2年 11月 10日現在)」が【参考1】として添えられている(pp.21-32)。
そこでは 240余りの団体が「内閣総理大臣による第25期会員候補の任命拒否に対する」抗議声明を出したことが表で示されている。このうちで、研究者自らが運営して、学術に関する機関誌を発行するなどの研究活動を行っている学協会(日本学術会議協力学術研究団体)は180であった。このような学協会は会員選考の際に情報提供を行う団体である。これまでに声明を出した多くの学協会は第一部(人文・社会科学)関連の学協会で、その会員数は延べ約13万人である。2000余りの学協会の情報は「学会名鑑」に公開されているのでそこから学会ごとの会員数を引き出して集計したものである。一人の研究者がいくつかの学協会の会員として活動することもあるので、実際の研究者数ではない。

一方で、第一部関連の学協会全体の会員総数は同様に重複を含めて延べ46万人である(埴淵 知哉・川口 慎介「日本における学術研究団体(学会)の現状」, E-journal GEO
Vol. 15(1) 137-155 2020)。

これらのことから、おおむね 35% の学協会会員が学協会を通じて声明を出している、あるいは学協会が人文・社会科学関連研究者の 35% の会員を代表して声明を出しているといえる。学術会議が会員の見解を代表して提言等を出すのとおなじ形だといえる。内閣府の統計によると第一部関連の大学等に所属する研究者数は6.9万人である
ことから、その35% である 2.4万人の研究者が実際に声明を出していることになる。

声明は第一部関連以外にも日本建築学会等の学協会や日本医学会(136学会で構成)
のように学協会の連合体で出しているものもあり、総数は数十万人に及んでいる。

このことから、我が国の科学者の多くが今回の学術会議会員の任命拒否に対して声
を上げているとみることができよう。

日本学術会議 第20期〜第25期初めにかけての年表:会員欠員、安保法制関連等の情報

2020/11/12 に改訂しました

日本学術会議の会員推薦方法が変更されて2005年に”新生学術会議”第20期が発足してから2020年の第25期会員の任命拒否までの年表です。議論される事項等を書き入れてあります。データはすべて公開されている文書から抜き出したものです。

リンク先のファイルでは文字の色分けで判別しやすくなっていますが、後にテキストも添えておきます。

日本学術会議 第20期〜第25期 年表

        日本学術会議第20期〜第25期 年表
2001/04/26 小泉純一郎内閣
第20期
2005/10/03 第146回総会 会員210名 2005/0/01付け任命 会長 黒川清
2006/02/13 第147回総会(臨時)
2006/09   会員1名定年退職、補欠会員1名任命
2006/09/26 安倍晋三内閣
2006/10/02 第149回総会 会長 金澤一郎
2007/09/26 福田康夫内閣
2008/09/24 麻生太郎内閣
第21期
2008/10/10 第154回総会 会員105名 2008/10/01付け任命 会長 金澤一郎
2009/09/16 鳩山由紀夫内閣
2010/06/08 菅直人内閣
2011/01/17 会員1名定年退職、補欠会員1名前任会員定年退職翌日付け任命
2011/03/11 東日本大震災
2011/06-07 会員3名定年退職、補欠会員3名前任会員定年退職翌日付け任命
2011/07/11 第160回総会(臨時) 会長 廣渡清吾
2011/08/01 会員1名定年退職、補欠会員1名前任会員定年退職翌日付け任命
2011/09/02 野田佳彦内閣
2011/09   会員3名定年退職、補欠会員3名 2011/10/01付け任命
第22期
2011/10/03 第161回総会 会員105名が2011/10/01付け任命 会長 大西 隆
2011/12   会員1名定年退職
2012/04/09 第162回総会 補欠会員候補者の承認
2012/04/30 会員1名辞職
2012/05/31 補欠会員1名任命
2012/11/30 補欠会員1名任命
2012/12/26 安倍晋三内閣
2014/04-07 会員3名定年退職(第22期末2014/09任期のため後任補充対象外)
2014/07/31 内閣府「日本学術会議の新たな展望を考える有識者会議」(第1回)
第23期
2014/10/01 第168回総会 会員105名 2014/10/01付け任命 会長 大西 隆
2015/03/20 内閣府「日本学術会議の新たな展望を考える有識者会議」報告書提出
2015/07/08 防衛施設庁「安全保障技術研究推進制度」公募開始
2015/09/06 会員1名定年退職(補充対象)
2015/10-2016/01 会員3名定年退職(補充対象)
2015/09/30 「平和安全法制」:自衛隊法等の一部改正等
2016/11/01 補欠会員1名任命
2016/06/24 安全保障と学術に関する検討委員会(第1回)
2016/05/15 補欠会員3名任命
2016/05-09 会員3名定年退職(補充対象)
2016/11/18 会員1名定年退職(第23期末任期のため後任補充対象外)
2016/12/01 会員1名退職(第24期末任期のため補充対象)
2017/02/04 学術フォーラム「安全保障と学術の関係:日本学術会議の立場」開催
2017/03/24 声明「軍事的安全保障研究に関する声明」
2017/04/13 報告「軍事的安全保障研究について」
2017/05/15 補欠会員1名任命(第24期末任期)
2017/04-09 会員8名定年退職(第23期末任期のため後任補充対象外)
第24期
2017/10/02 第175回総会 会員105名 2017/10/01付け任命 会長 山極寿一
2018/02   会員1名定年退職
        〈臨床医学〉(第24期末任期 補充対象)
2018/09/01 会員〈臨床医学〉逝去(第25期末任期 補充対象)
2018/09   会員2名定年退職
        〈基礎生物学〉(第24期末任期 補充対象)
        〈政治学〉(第24期末任期 補充対象)
2018/11/05 補欠会員2名任命
        〈臨床医学〉(第25期不再任)
        〈基礎生物学〉(第25期再任)
2018/10-2019/01 会員3名定年退職
           〈臨床医学〉(第24期末任期 補充対象)
           〈電気電子工学〉(第24期末任期 補充対象)
           〈材料工学〉(第24期末任期 補充対象)
2019/05/30 補欠会員4名任命
        〈臨床医学〉(第25期再任)
        〈臨床医学〉(第25期末任期として)
        〈電気電子工学〉(第25期再任)
        〈材料工学〉(第25期再任)
2019/6-8   会員2名定年退職
        〈臨床医学〉(第24期末任期 補充対象)
        〈言語・文学〉(第24期末任期 補充対象)
2019/11/18 補欠会員2名任命
        〈言語・文学〉(第25期再任)
        〈臨床医学〉(第25期不再任)
2019/10-2020/5 会員3名定年退職(第24期末任期のため後任補充対象外)
2020/09/16 菅義偉内閣
第25期
2020/10/01 第175回総会 会員99名 2020/10/01付け任命 会長 梶田隆章
2020/10/01 菅義偉内閣総理大臣6名の会員任命拒否