日本語論文は廃れるかもしれない現代版:システム面から考える

小保方さんのSTAP細胞騒動の際、その疑惑の一つに「他の論文から盗用しているのではないか?」という指摘がありました。
ちなみにですが、小保方さんに研究不正があったと認められた点は、世間で思われているよりもずっと少ないものでした。上記の盗用疑惑についても、「研究不正とは認められない」と調査結果が出ています(理化学研究所の報道発表資料「研究論文(STAP細胞)の疑義に関する調査報告について」などを参照のこと)。とはいえ、彼女はあまりにも研究者として教養がなさすぎたので、一切の擁護はできませんが……。
ともあれ、この疑惑が浮上したとき、日本の研究者からは「そんなとこまで出版社ってチェックしてんの?!」と驚きの声があがりました。研究者の側からすれば、孫引きなんて当たり前自分の過去の論文をそのままコピペして何が悪い!、出版社の方が忙しい中、世界中の論文と照らし合わせてまできちんと読んでくれてるだなんて、思いもよらないことでしたから。
しかし、もちろん出版社の人間がありとあらゆる論文を読んで覚えてるだなんて、ありえるはずもなく。そういうチェック機能が現在はあるというのが実際のところなのでした。
今回は、それに基づいた与太話となります。

さて、論文に盗用がないかをチェックするシステムは「剽窃検知ツール」などと呼ばれています。CrossCheckというサービスがおそらく最も有名で、投稿されてきた論文をそのシステムに通すことで、どのくらい盗用の疑いがあるかを機械的に判定することが可能というものとなっています。
このシステムにできることは、当たり前のことではあるのですが、疑いの割合を出すことまでです。「100%盗用である/ない」と言い切ることはできません。盗用した者が巧みに文章を書き換えていればその分オリジナル論文との合致率は下がりますし、あるいは、ある著者が完全に書き下ろしで論文を執筆したつもりでいたとしても(学術論文は作家が書く独創性あふれる小説ではないわけですから)できあがった文章が他の論文と似通ってしまっていたという可能性も捨てきれません。このシステムを利用する人は、必ずこの点について心に留めておくよう注意されるほどです。
この弱点は機械的なチェックには当然生じるものではあるのですが、ことに日本語論文では顕著になってしまいます。そう、翻訳されてしまえば、このチェックの網に途端にかかりにくくなるからです。

加えて、日本語論文は電子データベースに収載されている本数がとても少ないという問題もあります(科学技術振興機構J-STAGE「J-STAGE Similarity Checkのご利用案内」の3ページ目(10)など)。日本の学術論文の出版状況は、はっきりと言って遅れまくっています。論文検索のデータベースすらまともなものがないと、学術研究を少しでもされた方は感じたことがあるものと思います。
日本の行政、学会、出版社が電子化にやる気がない――というのも残念ながら否定はできないのですが――というよりは、日本語と電子化との相性の悪さが、この問題の根源にはあると考えられます。
日本語論文をせっかく電子化したとしても、全角・半角の違いがあるために、世界中にweb公開した途端に文字化けが生じます。論文のタイトルや巻号、ページ数といった情報(書誌情報と言います)も、英語対応しかしてない国際的な検索データベースには収載しにくいままです。電子化するためのシステム要件は、webで世界中に公開することを前提としているのですから、これまた英語で書かれています。英語というだけで日本人にはハードルが高いのに、さらにコンピュータの話とかマジワケワカラン状態です。
他にも、電子化するとApple社に高額なロイヤリティ取られるとか、そんなこと知らずに「電子版なんだから安くしろよ」とか平気で言う読者様の存在とか、問題は山積みです。
ぶっちゃけ、電子化に関する技術的・意識的な抜本的改革がない限りは、出版社はおろか、助成金をもらっている学会ですら赤字になってしまうそうです。こんな状況で盗用チェックにまでお金を出すとか、もう無理なわけです。

しかしながら、研究者の立場から物を言わせてもらえば、やっぱり盗用チェックはありがたい機能なわけです。
すでに述べたように、オリジナルで書いたつもりでも、すでに似たような記述をした論文はあるかもしれません。はたまた、自分のチェックミスで、引用文献を書き忘れてしまっているかもしれません。これらのチェックは、個人でやるには限界があります。出版社や編集部会が頑張ってサービスでやってくれるのなら、こんなに嬉しいことはありません。
ですが、このようなサービスの恩恵は、現状日本語論文ではほとんど受けることができません。ではどうするか?
その一つの答えが、英語論文への投稿、なのかと思います。特に、自然科学系の論文ではその傾向が加速していると感じています。このままいけば、日本語で論文を書こうという研究者はまったくいなくなってしまうのではないでしょうか?

私は、このような状況に、警鐘を鳴らしたいと思っています。
学術研究には、英語だけでは書けないものが存在するということを、忘れてはなりません。特に史学においては、その国の言語で書かれることが重要となるシーンが生じます。英語に馴染みやすい自然科学の分野においてすら、その国・風土の影響が色濃く出ることがあります(科学が社会の影響を受けることについては、すでに常識になっているものと思います)。医学のような分野においては、疾患によっては人種差や地域差が生じることもあり、ガラパゴス的に狭い国の中だけでまず議論をしてもらうことで埋もれずに成果をあげることができる可能性もあります。
盗用チェックシステムであるとか、国際的な論文データベースに頼り切ってしまう行為は、ともすればこの価値を人々から忘れさせてしまうかもしれません。

英語も日本語も、独語も、マレーシア語も、あらゆる言語が同等の価値のものとして電子化されることが、まず望まれます。が、これが実現するにはまだまだ時間がかかることでしょう。
ですので、私としては、研究者個人個人の意識改革がよいだろうと考えています。あるいは、学会や出版社の取り組み方に、英語圏に追随するだけでない、一本筋の通った考え方が欲しいと感じています。
つまり、具体的には(議論の根底からひっくり返すようなことで申し訳ないのですが)「盗用チェックシステムのようなものが本当に必要なのか?」と考えてほしいのです。
盗用チェックもデータベースも、便利だから流行っているにすぎません。発表される論文数が膨大になったため、その価値も並行して高まっただけのことです。そして、それと反比例するかのように、研究不正がないかどうかばかり機械的にチェックする編集・制作・世間の雰囲気が生まれてしまったのではという気がしてなりません。
その論文に価値があるかどうかは、じっくり読んでみて、ようやく初めてわかることと思います。自分にとって有益である論文は、他人にとってもそうであるとは限りません。被引用件数やインパクトファクターによってばかり研究者の価値を測っているような現状は、何だか違う気がしています。
論文が英語で書かれていなくとも、自分にとって必要なものだと思えば、仏語で書かれていようがヒンディー語で書かれていようが、何とか読めないかと努力するのが研究者の本来あるべき姿勢と思います。そして同様に、母国語である日本語論文だって、非常に有り難がって読まれるべきです。

翻って考えてみて、論文を提供する研究者の皆さんは、日本語論文だからと手を抜いて書いてしまってはいないでしょうか? あるいはその論文を掲載する編集者の方々は、どうせ国際誌に載らなかったものを投稿しているのだろうと、質の低いまま採択してしまってはいないでしょうか?
日本語論文の電子化の遅れや、そもそもの日本語の読まれにくさはありますが、それに胡坐をかいて投稿者も編集者もだらけていてしまっては、ますます日本の研究の質は落ちていく一方と思うのです。雑誌の価値が急速に下がっていると思うものも、散見される気がしてます。
今一度、日本だからこそ発信できるような研究について考えてみてほしいと思っています。そのうえで、いつかシステム屋さんが英語に限らずデータベース化する方法を実現してくれれば、日本語論文の価値は極めて高まるのではないでしょうか。

以上、電子化の難しさが日本語論文の衰退を招いているから始まり、編集者や出版社の責任、著者のやる気のなさもあるよ、と色々言ってみました。省みる点があったなあと思っていただけたら幸いです。
また、すでに「日本だからこそできる研究をしたい!」と頑張っておられる研究者や学会もあります。見かけましたら、ぜひ応援を。


Commented by zattoukoneko at 2018-05-24 06:39
私自身、現在進行形で、データベース検索ではできない「大量の文献資料をじっくり読み込む」という研究を行っています。
「よくそんな調査やってるねえ」と苦い顔をされることもありますが、それは他の人にはできないという意味でもあるわけで。お陰様で、非常に価値ある研究だと強い支持をいただくこともあります。

まあぶっちゃけ、出世街道に乗りたいのなら、英語で発表して、データベースも活用し、先行研究なんてテキトーに読んでおくのが効率的と思います。
でも私にはその方面の才覚はなかったし、だからこそパッとしない地味で根気のいる調査でもやってこれたのかなと感じています。

私のような働き方は過労で吐血するんで(実話)お勧めしませんが、
本当に価値があるのならメジャー・マイナーにこだわらずに研究されるのがよいと思いますし、世の中もそういう人を認められるようになってくれると嬉しいですね。
Commented by サイトー at 2018-06-13 17:45 x
疑問よろしいですか?
電子書籍化って本の値段安くならないんですか?
取次や書店の取り分がなくなるから出版社はウハウハって聞いたことあるですけど。
その取り分の分だけ読者に還元して安くしろよって僕は常々思ってるんですけど。
今の電子書籍は値段が高すぎです。
Commented by zattoukoneko at 2018-06-14 12:05
サイトーさん、ご質問ありがとうございます。

取次や書店の取り分がなくなるというのは正しいと思うのですが、それで出版社の儲けが増えるかというと違うと思います。なぜなら、別のところに費用が発生するからです。
たとえば電子書籍のビューワーを一から作る場合、プラットフォームの製作元に費用を支払う必要が生じることもあります。iOSなら、まずデベロッパー登録、その後売り上げから3割程度のロイヤリティ支払いだったかなと思います。
あるいはすでにあるビューワーを利用させてもらう場合、その提供先にやはりロイヤリティが必要となります。Amazonでの販売であれば、契約によって率は変わったと思いますが、7割程度を支払っていたかと。
これに加えて、電子版の制作、サイトへのアップロード作業などが紙版とは別に必要になりますから、人件費もプラスとなる可能性があります。これについては、制作段階で電子と紙を両方意識して作るようにすれば、ある程度軽減できるとは聞いていますけれど。
このように費用はあちこちでかかるので、取次・書店がなくなったからといって、「ウハウハ」とはならないものと思います。

とはいえ、実際には電子版を安く売っていることも(一般書、特に漫画)多いですよね。これは上記の製作費以上に、広告効果が大きいからと思います。
電子版を売ると、その分紙の本の売り上げが落ちそうなものに思うのですが、実際には変わらないか、むしろプラスになることが多いとされています。一般書では、(Amazonの言い分によると)電子:紙は3:10の割合で売れていくのだそうで、電子版の売り上げが増えると紙も一緒に上がるとのことです。
したがって、電子版に製作費が大きくかかったとしても、(一般書であれば)価格をさほど変えずに売っていくことができるわけです。しかし、大幅値下げとまでは3:10の割合ではできそうにありませんね。
Commented by zattoukoneko at 2018-06-14 12:05
さて、一般書であれば上の話までで済むのですが、学術書の場合はさらに制作の手間が上乗せされます。本記事でも書いた剽窃チェックツールの導入や、検索データベースへの収載(近年では、データベース元が登録するのではなく、出版元が登録する流れになりつつあります)、災害時や版元倒産後も閲覧可能なサーバーの確保など、費用はうなぎのぼりとすら言えます。
そのうえ、専門書なんて買ってくれる読者数がそもそも百とか千の単位なのですから、3:10の割合程度ではとても元を取ることはできなさそうです。
現在、電子化の進んでいる海外出版社では、「著作権使用料を高額にする」「電子版論文1本の販売価格を数百ドル」「電子は無料にするけど、紙の雑誌は年間数万ドル」といったやり方で制作費を回収しているようです。特に一番最後は現在大問題になっているようですね、図書館が購入できなくなりつつあると聞いています。

最近では、いわゆる漫画村騒動がありましたが、電子版の公開サイトなども出版社負担で整備していく流れになるのではないでしょうか?
紙の本をそのままPDF化しているわけではない、とご理解いただくのがよいと思います。
by zattoukoneko | 2018-05-23 03:13 | 社会・経済 | Comments(4)