Jun Araki’s Blog
随所に主となれば立処皆真なり

2014 年 9 月 9 日

SIGIR 2014 参加報告

Filed under: Research — araki @ 10:44 AM

約一年ぶりの更新です。やや以前の話ですが、二ヶ月程前に SIGIR 2014 に参加してきました。その学会で参加報告を依頼され、執筆したのですが、それが日本データベース学会のメーリングリストアーカイブ上で誰でも閲覧できるように公開されています。自分の備忘録も兼ねて、本ブログにも転載します。

——————————————————————————-

SIGIR 2014に参加して 荒木淳(カーネギーメロン大学 博士候補生)

2014年7月6日(日)から7月11日(金)までの日程でオーストラリアのゴールドコーストで国際会議SIGIR 2014が開催されました.会場はGold Coast Convention and Exhibition Centreでした.ゴールドコーストは,オーストラリアの東海岸に位置する同国最大の観光保養地として知られています.この時期は冬でしたが,それでも気候は温暖で,最高気温が22℃程度,最低気温が8℃程度でした.しかしながら,オゾンホールの影響もあるのか筆者には日差しが強く感じられ,日中はほとんど会場内にいたものの,念のため日焼け止めを利用していました.

SIGIRは情報検索(IR)の分野のトップカンファレンスであり,1978年に開催されて以来,今回で37回目を迎えました.筆者の専門は自然言語処理(NLP)であり,NLPの分野の国際会議には参加したことがありましたが,SIGIRに参加するのは初めてでした.NLPにおけるトップカンファレンスであるACLにもまだ一回しか参加したことがないのですが,ACLとSIGIRの両方に参加した経験から感じた両者の違いについて三点ほど触れようと思います.

まず,論文の採択率についてです.今回のSIGIRではfull paperが 82/387(21.2%),short paperが 104/263(39.5%) でした.一方,今年のACL(ACL 2014)では 146/572(25.5%),short paperが 139/551(25.2%)でした.このことから,SIGIRの方がshort paperは採択されやすいという傾向が見えます.実際に,今回筆者が発表した論文もshort paperで,ある授業の中で取り組んだ研究に関するものでした.

次に,研究で用いられる評価手法についてです.両会議で発表される研究では,確立された評価指標を用いて提案手法を定量的に評価する点は共通していますし,評価指標自体も研究テーマになり得えます.ただ,SIGIRの方が,検索エンジンという既に世に普及した実装が存在することもあって,例えばユーザーや時間軸の視点からの評価のように,心理学的観点も含めたより多様で実際的な評価手法が多い印象を受けました.

最後に,賞関連です.ACLにもBest Paper AwardとLifetime Achievementという賞はありますが,SIGIRでは今年からTest of Time Awardという賞を取り入れ,2002年から2004年の中でも最も優れた研究が表彰されました.企業からのスポンサーシップも比較的多いと思います.学生に対する参加費援助(travel grant)についても,どの程度の割合の学生がどの程度の支援を受けたのかという全体的な統計は分かりませんが,SIGIRの方が支援が手厚いように思われます.筆者は今年SIGIRからSIGIR Student Travel Grantという参加費援助を受けました.筆者はアメリカからの参加で渡航費が非常に高かったのですが,学会登録費や宿泊費などを含めて総額の半分くらいを支援していただきました.

SIGIRは長い年月を経て実用面での貢献にも寄与しながら研究コミュニティを発展させたため,研究分野に対する自負のようなものと若手研究者の挑戦を奨励するような雰囲気があります.これは以前のNewsletterのSIGIR 2013参加報告で言われていたことであり,上記のSIGIRとACLの違いだけでなく,banquetやstudent lunchなどのイベントでシニアな研究者の方々とお話しをする中でも感じたことです.ビジネスミーティングではSIGIR 2015はサンティアゴ(チリ),SIGIR 2016はピサ(イタリア),SIGIR 2017は東京で開催されるとの発表がありました.若手の皆さんも積極的に挑戦してみてはいかがでしょうか.

(荒木淳 カーネギーメロン大学 コンピュータサイエンス学部言語技術研究所 博士候補生)

——————————————————————————-

[2015.4.26 追記]
学会参加時に撮った写真をいくつか下に追加します。

CIMG1585
会場となった Gold Coast Convention and Exhibition Centre の玄関前。コアラのオブジェがお出迎え。

CIMG1598
SIGIR 2014のスポンサー企業をいくつか。

CIMG1584
リゾート地らしい凝ったデザインのコンドミニアムと思われる建物が多く見られます。

CIMG1586
Gold Coast 周辺を走る路面電車 GoldLinQ。2014年7月に開通したばかりのようで、奇抜な青色が目立ちます。

2010 年 6 月 10 日

春学期を終えて

Filed under: Miscellaneous,Research,Studying Abroad — araki @ 12:05 PM

久しぶりの更新です。今学期もこれまで通り RA とクラスの受講を継続しました。今学期はクラスへのワークロードをこれまでより少なくしたのですが、それでも次から次へと慣れていない出来事が起こってくるので大変でした。期末試験最終日に行われたあるクラスのプレゼンテーションでは、その前日に不覚にも風邪を引いてしまったのですが、何とか乗り切りました。

ただ全般的にはクォータ内のワークロードの大まかな傾向 (例えば Midterm までの前半に課題が集中しやすいなど) が感覚的に掴めるようになったので、これまでよりは上手くやれたような気がします。このポストは単なる雑記の羅列ですが、備忘の意味も込めて、先学期の終わりからの出来事を時系列の降順に書いておきます。

  • 転居準備 (6 月)
  • ルームメイトが 6 月頭にキャンパス外の家に引っ越してしまったのですが、私も 5 月に別の寮へのアサインが決まったので、入居時期の交渉とともに転居の準備を少しずつ進めています。今回は転居と言ってもキャンパス内の移動なので、それ程大した手間ではないです。

  • 新卒業要件のアナウンス (5 月)
  • 5 月下旬に、私が現在在籍している MS プログラムの卒業単位要件が今秋から変更されるというアナウンスがありました。資料がやや分かりにくいのですが、こちらに置いてあります。今秋より以前に入学した学生は入学当時の卒業単位要件のままでも良く、新要件で卒業するかどうかは本人の選択に委ねられています。私は、これまでの学生生活の中で自分の専門分野に近しい学科が新しく創設されるといった変化は経験したことがありますが、在籍中の学科の卒業要件が変わるといった経験は初めてです。今回の変更の趣旨は、MS プログラムの学生が早めに研究に携われるように必須科目と専門科目の選択の可能性をより柔軟にした、ということのようです。選択肢が増えるのは基本的には良いことですが、これまでに取得した単位と照らし合わせて新要件を吟味する必要が出てきました。

  • クレジットカード勧誘のダイレクトメール (5 月)
  • 今年の 1 月末に学内の SFCU で学生向けのクレジットカードを作ったのですが、その後友人のアドバイスに従って毎月支払い期限の一週間くらい前には支払いを済ませるようにしていました。そうしたところ、5 月頃からクレジットカード勧誘のダイレクトメールがちらほら届くようになりました。クレジットカードは基本的に複数枚持っていた方がクレジットスコアを上げるには良いようなので、後で適当なタイミングでクレジットスコアの確認とクレジットカードの選定/申請をしようと思っています。

  • 確定申告 (4 月)
  • 私は日本では確定申告をしたことがなかったのですが、ここ米国で初めて確定申告 (tax filing) をしました。米国では会社員であっても給与所得者一人一人が確定申告をする仕組みであり、それは大学院生 (留学生) も例外ではありません。米国税法上のステータス区分に始まり、各種フォームの作成など、確定申告自体が初めての私にはなかなか大変でした。スタンフォード大学で 4/1 に開催された留学生用の taxation workshop に参加したのですが、そもそも tax filing に関する情報の量が膨大であることもあり、説明も分かりにくく思えました。友人や知人にメールで質問したりして、何とか済ませることができました。

    実際の手順ですが、Federal 用のフォームについては CINTAX というオンラインソフトウェアのアカウントが大学側から提供されるので、それを利用することで比較的簡単に作成することができました。4/5 にフォームを発送し、4/28 に銀行口座に還付金が振り込まれていました。State 用のフォームについては CalFile などのカリフォルニア州の公的な電子サービスがあるのですが、これらは 2 年目から使えるようであり、今回は自分で一から作成せざるを得ませんでした。4/12 にフォームを発送し、5/20 に同様に還付金が振り込まれていました。今回は初めてでしたが、tax filing を通して否が応にもある一定のフィナンシャルリテラシーが身に付くようになる気がします。今回の tax filing で参考にさせていただいたサイトへのリンクを載せておきます。
    Masayuki Wakana, CPA (若菜雅幸 米国公認会計士)

  • AAAI への入会 (4 月)
  • Association for the Advancement of Artificial Intelligence (AAAI) に入会しました。AAAI の正式名称は、以前は American Association for Artificial Intelligence でしたが、国際性を配慮して 2007 年に今の名称に変更したようです。日本語に直訳すると、「人工知能推進協会」のようになるでしょうか。略称は以前と変わらず、AAAI のままです。この学会も会員専用のリソースが非常に豊富です。2010 年 6 月現在、米国内の学生会員 (Student membership) の年会費は $55.00 になっています。

  • ルームメイトの和食テイスティング (3 月)
  • 以前のポストに書いたようにルームメイトはインド系二世のアメリカ人なのですが、彼は意外に和食好きだということが分かりました。昨年末のある週末に彼が風邪を引いて寝込んでしまった時があったのですが、風邪に良いだろうと思って、私の作った味噌汁を分けてあげました。母親のインド料理を中心として育ってきた彼は、それまでは寿司は食べたことはあるが、味噌汁は初めてだということでした。ところが、彼は私の作った味噌汁を美味しいと言います。最初はお世辞を言っているのかと思っていたのですが、その後も何回か分けてあげていると、どうも本気で美味しいと思っているようだということが分かってきました。スプーンで味噌汁を食べながら、”This is tasty, Jun!” と言っている姿が可笑しかったので、もう少しチャレンジングな和食を実験したくなりました。まず豆腐とえのきを味噌汁に加えて食べさせたところ、全く問題ありませんでした。次に納豆をご飯と一緒に食べさせてみたところ、さすがに美味しそうな顔はしていませんでしたが、それでも普通に食べていました。寿司のような代表的な和食を好む米国人は多いようですが、味噌汁のような基本的な和食を好む米国人も結構多いのかも知れません。

  • ジョギングの再開 (3 月)
  • 渡米前に日本で続けていたジョギングを春休みに再開しました。スタンフォード大学周辺は緑も多く、ジョギングなどの運動をするのは非常に快適です。学期中は忙しくてなかなか時間が取れないのですが、今度は大学のジムにも行ってみようと思っています。

2009 年 10 月 10 日

Research Assistantship のオファーを頂く

Filed under: Research,Studying Abroad — araki @ 5:08 PM

8 月中旬にスタンフォードに到着してから 2 ヶ月弱が経ち、生活自体にはだいぶ慣れてきましたが、それでも授業が始まったこともあり、相変わらず毎日目が回るような忙しさが続いています。そのような中で、先日スタンフォード大学言語情報センター (CSLI: Center for the Study of Language and Information)Computational Semantics Laboratory より Research Assistantship (RA) のオファーを頂きました。これにより、この秋クォータの授業料が全額免除され、さらに stipend というお給料を頂くことになりました。

スタンフォード大学コンピュータサイエンス学部の M.S. プログラムでは Ph.D. プログラムと違って財政援助 (financial support) が保証されていません (米国内の他の大学も同じような状況のところが多いと思います)。その状況下で私は RA をさせていただける研究室を模索していました。まだ慣れない英語での面接ではあまりうまく自分をアピールできていなかったので正直自信が無かったのですが、この RA オファーの知らせを頂いた時は大学院合格の知らせを頂いた時と同じくらいに嬉しかったです。

少し冷静になって、この私という一学生の授業料と生活費になるお金の出処を考えてみると、それは基本的に教授が獲得してきたグラントです。さらに突き詰めて考えると、そのグラントには (全てではないにしても) 米国市民の税金が含まれているはずです。その対価として従事する研究活動に当然ながら責任を感じます。

授業の方も大量の宿題が毎週のように出ている中で、RA も加わるとなると今の自分の限界を少し越えているような気もしますが、この最初のクォータが正念場になることは間違いないので必死に頑張っていこうと思います。その一方で、留学体験者の話で留学後数ヶ月くらい経って慣れてきた頃に体調を崩す方が多いという話を聞いたことがありますので、体調管理には特に気を付けようと思います。

2009 年 9 月 16 日

ACL に入会

Filed under: Research — araki @ 9:28 AM

先日 ACM に入会しましたが、それとほぼ同じタイミングで Association for Computational Linguistics (ACL) にも入会しました。学生会員資格は年間 $30 から用意されています。ACL の方も Web 上のフォームで Student Membership Application を提出したのですが、その後会員番号などの会員情報が何も送られてこなかったので、念のため入会が認められたかどうかをメールや電話で問い合わせていました。今日になってようやくそのメールの返信が届き、確かに会員になっています、とのことでした。どうも ACL では会員番号は発行せず、名前で会員を identify する仕組みのようです。

2009 年 9 月 2 日

ACM に入会

Filed under: Research — araki @ 12:29 AM

以前から無料の web account は持っていたのですが、この留学を機に Association for Computer Machinery (ACM) に入会しました。学生の場合、年間 $19 から会員資格が用意されています。8 月下旬に入会申し込みを行って、9/1 に学生会員資格が得られました。利用可能なリソースが多過ぎてまだ全体を把握してきれていませんが、これから有効に活用していきたいです。

2009 年 5 月 6 日

第 19 回世界コンピュータ将棋選手権大会に参加

Filed under: Events,Research — araki @ 10:22 AM

昨年は多忙のため参加できなかったのですが、今年は第 19 回世界コンピュータ将棋選手権大会に参加してきました。昨年の 6 位だった大槻将棋が準優勝しました。今回自分は全くと言っていいほど貢献が無かったのに表彰式に出させてもらい、大変恐縮でした。

昨年は優勝、準優勝プログラムがエキシビジョンマッチながらアマトップを破るという快挙が生まれましたが、今年は多くのチームが全体的にさらに強くなり、実力が伯仲した印象を受けました。決勝戦で昨年の上位チームがことごとく負けたこともこの裏付けです。この主たる要因は、プロ棋士の棋譜を中心として数万局程度の棋譜を機械学習させるというソフトウェア上の技術改良 (いわゆる Bonanza 学習) が 2006 年に広まり、ほとんどのチームがそれを取り入れてきた結果であろうと思います。将棋のレベルについては、双方 25 分の持ち時間で指される対局中に将棋アマチュアの私がもはや指し手の良し悪しをどうこう言えるレベルではありませんでした (特に中終盤)。

来年以降も楽しみです。

2008 年 2 月 3 日

ボロノイ図とドロネー図

Filed under: Research — araki @ 11:41 PM

とある本に出てきて、もしかしたら後で道具として使えそうな気がしたのでメモしておきます。

ボロノイ図

ある距離空間上の任意の位置に配置された複数個の点 (母点) に対して、同一距離空間上の他の点がどの母点に近いかによって領域分割された図。

ドロネー図

隣接するボロノイ領域の母点同士をつなぐ線分によって領域分割された図。

ボロノイ図については、1908年にロシアの数学者 Georgy Fedoseevich Voronoi が n 次元の場合の研究をしました。応用には、携帯電話の基地局探索、降水量予測、学区設定などがあります。ドロネー図については、Voronoi の後輩であるロシアの数学者 Delaunay が考案しました。応用には、ポリゴン生成のようなモデリングなどがあります。サッカーのシミュレーションやコンピュータ囲碁にもこういった図を適用すると面白そうです (両者の分野ともに、実際に適用している研究は既に有るようです)。

Wikipedia のリンクをメモしておきます。

2007 年 12 月 24 日

n-armed bandit problem

Filed under: Research — araki @ 10:24 PM

n-armed bandit problem という問題に取り組んでみました。

アームが n 個付いたスロットマシンがあり、それらのアームを引くとそれぞれ確率 p1, p2, …, pn で
1ドルの賞金がもらえる機械を想定する。このとき、p1, p2, …, pn が未知として、N 回アームを引いた
際の賞金の期待値を最大化する戦略を求めよ。

強化学習の分野で昔から研究されている問題であり、問題の設定自体はシンプルですが、解くのは非常に難しいです。いくつか気になった文献をメモしておきます。

2007 年 11 月 6 日

IBIS2007

Filed under: Events,Research — araki @ 10:25 PM

今日は一昨日に引き続き、東工大に足を運びました。会場も同じくすずかけ台ホールにて、 IBIS2007 の午前中のセッションに参加しました。応用研究が多いかと思ってましたが、予想以上に理論的な研究が多かったです。印象に残ったことをとりあえずメモしておきます (この辺も含めて後で Wiki にまとめたいところです)。

  • 保木さんが最適制御理論から将棋を数理モデルと見なしていたこと。化学者らしい発想と思いました。後で調べて分かったことですが、最適制御理論は経済学などにも応用されているらしいです。
  • Bonanza では全幅探索を使用して、局面数は 3 の n 乗オーダー。枝刈りは末端で行っている程度。
  • 自己学習 (ゲームで言えば、自己対戦に基づく評価関数の改良) がバックギャモンではうまくいって、チェスでうまくいかなったという事実。機械学習の観点から考えると、自己学習が可能なゲーム (問題) であるかどうかは単に評価関数の単純さ (特徴量の少なさ) に依存するということなのでしょうか。
  • ある研究者の方曰く、理論が第1の科学、実験が第2の科学とすると、シミュレーションが第3の科学、大量データ処理が第4の科学、らしいです。

セッション後は、保木さん、友人と一緒に昼食をとり、会社へ行きました。

2007 年 11 月 4 日

SIG-FPAI

Filed under: Events,Research — araki @ 11:00 PM

東工大で開催された SIG-FPAI の2日目に行ってきました。中でも産総研の本村さんの発表が興味深かったです。ベイジアンネットによるユーザモデル構築の話で、映画推薦システムのデモ映像を発表されていました。適用可能な範囲は広い技術なので (例えばカーナビなど)、今後に期待できそうな技術の一つと思います。

ベイジアンネットつながりで言うと、最近スパムフィルタをもう少し何とかしたいです。とりあえず早くメールサーバを IMAP にして導入せねば、というところです。

Powered by WordPress