人気ブログランキング | 話題のタグを見る
.
arXivとの戦い
ちょっとした理由があって、最近掲載が決まった論文をarXiv/cond-matにアップロードする事に。

arXivとは、出版前(後も?)の論文などをアップロードして世界中に公開できるサイトです。例えば最新の実験結果を宣伝したい時などに論文掲載決定を待たずして公開するために使われるのですが、誰でもアップロードできてしまうので、内容の質は玉石混合という感じ。詳しくはウィキベディアの「arXiv」を参照。


今回僕がアップロードしたのは、最近雑誌に掲載が決定した内容ですが、いち早く読んでもらいたい人がいるということで公開する事にしました。

ただ、このアップロードの作業が一筋縄では行かない。。。

arXivの投稿の仕方について書いたページはいくつかありますが、その通りにやっても上手く行かなかった部分もあるので、今回(2009年12月現在)やってみて上手く行った手順を書き留めておきます。誰かの何かの参考になれば。

1. 原稿を準備する
 arXivはtex形式での投稿を推奨しています。実際に学術誌に投稿する時はtexが使われる事が多いので、tex形式で準備されている事を前提にして話を進めます。まずは原稿のtexファイルと、図のepsファイルを準備します。今、その名前が「manuscript.tex」「Fig1.eps」だとします。図はもちろん複数個あってもかまいません。図と本文のファイル名も半角英数であれば何でも良いでしょう。

2. この段階でtexコンパイルできる事を確認する
 僕は原稿を書いている段階では図のファイルを下層フォルダに入れてバージョン番号をつけて管理しているので、arXivにアップロードする用に別のフォルダにtexファイルとepsファイルを持ってきてコンパイルしようとすると、epsファイルへのリンクを直し忘れたりする事がありました。
そんな間抜けなミスをしないために、この段階でtexファイルとepsファイルを同じ階層に置いてコンパイルができ、dviファイルが生成され、さらにそれがdvipdfmxなどでPDFに変換できる事を確かめておきましょう。

3. 00README.XXXファイルを準備する
 ここが今まで知らなくて苦労した点です。まず、arXivのシステムはアップロードされたtexファイルをコンパイルして、そこからps(ポストスクリプト)ファイルを作り、さらにそれをPDFへと変換しているようです。そのpsファイルを作る際に、図のepsファイルに含まれている余分な情報をそぎ落とす作業が入るのですが、その「余分な部分をそぎ落とす」というのがくせ者です。
 グラフソフトで図を直接epsとして吐き出した場合などは、図の情報はベクトルデータで構成されている事が殆で、余分な情報は「コメント行」として「%」マークで始まる行に書かれています。
 例えば適当なepsファイルをテキストエディタで開くと中身はこんな感じ。
%%CreationDate: 10/14/99
%%Copyright: (C) 1994, 1999 Deneba Systems. All Rights Reserved
userdict /CVDict 200 dict put
CVDict begin
/invalidcolortable? true def
/level2 /languagelevel where {pop languagelevel 2 ge}{false} ifelse def
これはファイルの途中の数行を例として取り出した物ですが、最初の2行は図の情報とは関係ない余分な情報なので「%」で始まる行としてコメント行になっています。

しかし、例えば写真のjpgファイルや、ビットマップで作った図をepsファイルにしたいとき、イラストレーターなどのソフトに一度そのjpgやbmpファイルを読み込んでepsファイルとして吐き出させる事があると思います。そのようなビットマップ系の情報が含まれたepsファイルには、図を描くための情報として「%」マークが使われることがあるようです。これをアップロードすると「%」で始まる行はarXivのサーバー上での処理でそぎ落とされてしまうので、図の情報が欠落する事になります。そのような場合、「arXivにはアップロードできたのだけど、PDFが上手く生成されない」という事態に陥ります。

arXivにアップロードした後送られてくるメールに「*** WARNING: PS BAD ***」と書かれていたら、まずこれにはまっている可能性が高いと思われます。

これをさけるために、原稿と図のファイルと一緒に「00README.XXX」と名付けたテキストファイルを送る必要があります。詳しくはhttp://arxiv.org/help/00READMEに書かれていますが、このように名付けたテキストファイルに定められたオプションを記述しておくと、arXivサーバー上でpdfを生成する際に特殊な処理をしてくれるようです。

今はepsファイルがビットマップデータを含んでいる場合にのみ話題をしぼりますが、問題なのは「%」のつく行がそぎ落とされてしまう事なので、「%で始まる行(コメント行)は残したままpsファイルを作って、それをPDFにしてね」という命令を送る必要があります。これには、1行
manuscript.dvi keepcomments
と書きます。上の「manuscript」の部分は自分の用意したtexファイルの名前を入れてください。

この1行を書いた「00README.XXX」という名前のテキストファイルを用意して原稿と図のファイルと一緒にアップロードすることで、epsがビットマップデータを持っている場合の問題は解決できるようです。(もし上手く行かない場合は、00README.XXXファイルの改行コードや文字コードを疑ってみてください)

4. 圧縮ファイルを作る
 この過程は必ずしも必要ではありませんが、アップロードするときに必要なファイルをひとまとめにしておくと便利です。圧縮はtar.gzかzipが対応しているようです。例えば
$ tar -cvzf manuscript.tar.gz manuscript.tex Fig1.eps 00README.XXX
のようにtarコマンドを使えば圧縮ファイルが生成され、これを送ればサーバー上で展開して処理してくれます。

5. いざ、アップロード
 arXivはログインページが見つけにくいですが、本家のhttp://arXiv.orgのメインページの右上には(小さいですが)「Login」の文字があるのでそこから入れます。初めて使う人はもちろん登録が必要です。

ログイン後に「http://arxiv.org/submit」から投稿ページに行けます。メインページから一発で投稿ページに誘導されるような構造になっていないのはかなり不親切ですが。。

投稿ページで諸情報を打ち込んで、先ほど圧縮したファイルをアップロードすると、arXivからメールが来ます。それをみてエラーメッセージが出ていなければオーケーです。しかしそれで安心せずに必ずそこに示されている自分の投稿のURLに行き、正しくPDFが見れるかチェックするようにしましょう。

6. 容量制限について
 よくarXivは容量制限がキツいという話を聞きますが、ざっとヘルプのページを見た限り「何MB以上はダメ」という記述は見当たりませんでした。でも、世界中にミラーされていろいろな環境の人がダウンロードする可能性がある以上ある程度小さくしておくのが推奨されているようです。

ちなみに今回僕がアップしたのはダブルカラムで11ページ、図が9個含まれている論文ですが、図と原稿のファイルの合計が6.4MB、まとめて圧縮したファイルの大きさが1.9MBでした。これでもアップロードできたので、最近は規制が緩くなっているのかも。


長くなりましたが、ここまで書いた事は2009年現在の仕様のarXivで上手く行った一つのケースという事で絶対に正しいという事ではないかもしれませんが、参考になればと思い、メモとして書き留めておきます。

一番良いのはarXivのHelpページを隅々まで読む事。もちろんこれが正攻法なのですが、やはり画面いっぱいの英文を読むのはしんどいですよね。(^_^;
もしまた未知のトラブルが起こったら英語の修行だと思って気合いで読むしかないか。。。
by nt-neutron | 2009-12-16 02:00 | 研究日誌
<< D論審査 短い話 >>


.

某私大で助教を4年間勤めたあと、現在はR研でポスドク。専門は磁性・中性子散乱。
by nt-neutron
S M T W T F S
1 2
3 4 5 6 7 8 9
10 11 12 13 14 15 16
17 18 19 20 21 22 23
24 25 26 27 28 29 30
31
検索
カテゴリ
全体
日記
研究日誌
出張
Mac
未分類
ブログパーツ
お気に入りブログ
寅二
以前の記事
2017年 04月
2016年 12月
2016年 11月
2016年 10月
2016年 09月
2016年 08月
2016年 07月
2016年 06月
2016年 05月
2016年 03月
2016年 02月
2016年 01月
2015年 12月
2015年 11月
2015年 10月
2015年 09月
2015年 08月
2015年 07月
2015年 06月
2015年 05月
2015年 04月
2015年 03月
2015年 02月
2015年 01月
2014年 12月
2014年 11月
2014年 10月
2014年 09月
2014年 08月
2014年 07月
2014年 06月
2014年 05月
2014年 04月
2014年 03月
2014年 02月
2014年 01月
2013年 12月
2013年 11月
2013年 10月
2013年 09月
2013年 08月
2013年 07月
2013年 06月
2013年 05月
2013年 04月
2013年 03月
2013年 02月
2013年 01月
2012年 12月
2012年 11月
2012年 10月
2012年 09月
2012年 08月
2012年 07月
2012年 06月
2012年 05月
2012年 04月
2012年 03月
2012年 02月
2012年 01月
2011年 12月
2011年 11月
2011年 10月
2011年 09月
2011年 08月
2011年 07月
2011年 06月
2011年 05月
2011年 04月
2011年 03月
2011年 02月
2011年 01月
2010年 12月
2010年 11月
2010年 10月
2010年 09月
2010年 08月
2010年 07月
2010年 06月
2010年 05月
2010年 04月
2010年 03月
2010年 02月
2010年 01月
2009年 12月
2009年 11月
2009年 10月
2009年 09月
2009年 08月
2009年 07月
2009年 06月
2009年 05月
2009年 04月
2009年 03月
2009年 02月
2009年 01月
2008年 12月
2008年 11月
2008年 10月
2008年 09月
2008年 08月
2008年 07月
2008年 06月
2008年 05月
2008年 04月
2008年 03月
2008年 02月
2008年 01月
2007年 12月
2007年 11月
2007年 10月
2007年 09月
2007年 08月
2007年 07月
2007年 06月
2007年 05月
2007年 04月
2007年 03月
2007年 02月
2007年 01月
2006年 12月
2006年 11月
2006年 10月
2006年 09月
2006年 08月
2006年 07月
メモ帳
ライフログ
タグ
その他のジャンル
ファン
記事ランキング
ブログジャンル
画像一覧