指導

現在、いろいろと更新中です

博士研究を指導するようになって、毎年、同じようなことを大学院生に伝えていることに気がつきました。これらの点を意識するだけで、研究の質・パフォーマンスは上がるはずです。ぜひ、意識してみてください。

理論

夏休みの自由研究と、大学院生・研究者の研究は何が違うのでしょうか? 「とりあえず数えました」「こんなことを観察しました」ということは、本格的な研究とは言えません。研究とは、研究対象としてある動物を選び、アイディアを検証する作業です。

・一般性のある理論・仮説に興味があるので、研究対象の自然史(ナチュラルヒストリー)を知る必要はない
・自分の研究対象を溺愛しているので、他の種にも当てはまるような理論に興味がない
・動物をぼーっと見ていたい
これらは研究としては不完全になりがちです。理想は、
・研究対象の生き様全体に対して深い理解をもち、
・研究分野の理論を十分理解し、
・研究対象の観察経験から、自分なりのクエスチョンを見つけ、検証する
ということだと思います。
これらの点の、どれもが欠けないような研究を目指してほしいと思います。そのためには、研究対象をよく観察し、教科書・論文をよく読み(一日一本)、そして自分の観察経験と知識から、頭を使って、過去の報告と自分がみているものに違いはないか? 正しいといわれている理論やその仮定は本当に正しいか? 面白い実験はできないか? 他の説明可能性はないか? などを考えてみるといいでしょう。

実際には、観察をはじめて、論文を読んで、クエスチョンを見つけて、、、というのは、大学院生には難しいと思います。お勧めしていることは、これら三つを同時進行で、しかもお互いに行きつ戻りつする方法です。ちょっと面白い観察をしたら文献を調べてみる、ゼミで聞いたことが自分の研究対象にあてはまらないかどうか調べてみる、などなど。こういうことを繰り返していくうちに、クエスチョンが固まってきますし、動物を見る目も養われてきます(難しい言葉を使うと、このような往復作業をabductionといいます。帰納 inductionと演繹deductionの中間のような姿勢を指します)。

理論的に考えるためのヒントです。
変数はなにを取っている? 研究でどういう変数を取っていますか? 5項目の行動? 個体の性? 順位? 血縁?
変数間の関係のなかで、理論的に意味のあるものはどれ? たとえば、10の変数をもっていたとしたらば、「○●が■□を予測する」という組み合わせは45通りあります(XとYの位置を区別したらば90通りになります)。では、それらすべては意味のあるものでしょうか? そうではなくて、どの変数とどの変数が、どういう仮説のもとでどういう関係にあると予測されるのか、ということを考えてみてください。そうすると、おのずと、どの変数とどの変数の関係をみるべきかが分ってくるでしょう。

行動観察

動物の行動を観察する際、いくつかの方法と、いくつかの注意点があります。
まずは、「行動研究入門 動物行動の観察から解析まで」(東海大学出版会)の第4章を読んでみてください。この教科書は、時代を経ても変わることない価値をもっており、多くの研究者がここに書いてある手法を用いています。

フィールドノートを作ろう
研究に関するあらゆることを記すノートがあると、後々便利です。人によってそれぞれですが、研究室ではコクヨのフィールドノートを使っています(ラボに買い置きしてあります)。
フィールドノートには、あらゆることを書きましょう。調査を開始した時間、ある場所に到着した時間、見た個体、調査地でみた(で、種名を知らない)動植物の簡単なスケッチ、移動したときの時刻表・値段、宿に帰ってからやらなくてはいけないこと、などなど。こまめに記録しておく習慣をつけておくと、後々、役に立つことがあります。

フィールドノートの取り方は人それぞれです。後述するように、自分に分る記号を作ると楽です。たとえば、
8:3:56 TK -> NG
で、TKがNGに毛づくろい、という意味を表す、など。これを言葉や文章で書いていると、記録に時間がかかってしまいます。また、毛づくろいが終わったらば、
8:3:56 TK-> NG ~ 8:4:55
などと書き足せばいいでしょう。このように、agは攻撃、subは服従、など、自分に分る記号を作っておくと便利です。


個体識別をしよう
動物を研究する上で、個体識別は基本中の基本です。まずはよく見て、肉眼で個体識別できるかどうかを試してみましょう。
最初はどの個体も一緒に見えてしまうでしょうが、それは無理もないことです。分りやすい特徴(傷跡、尾の曲がり具合、体の色、毛がはげているところ、などなど)を、できるだけ記録しましょう。また、デジカメで顔の写真を撮るなどして、繰り返し繰り返し、観察しましょう。そうすると、「あれっ、この個体、さっきもいたような?」ということが分かるようになります。
そのような作業を繰り返していくことによって、研究対象動物の見分けがつくようになります。
肉眼で個体識別できない動物には、なんらかのマークをしてやる必要があります(鳥なら足環、哺乳類なら毛染めなど、魚なら色素など)。
腕時計は秒針があるデジタルを使います。アナログは、ぱっと見て時間が分らないので、観察には使えません。人によってやり方が違うでしょうが、(1)観察対象、(2)フィールドノート、(3)時計、の三つの間で、視線を素早く動かせるようにして、できるだけ、観察対象から目を放さないようにしましょう。データを取っていたらば、観察対象がどこかに行ってしまった、大事な行動を見逃してしまった、ということが初心者にはよくあります。

行動が早すぎる場合には、ビデオで撮影することをお奨めします。ただし、ビデオの分析は、撮った時間の数倍はかかります。このため、ビデオでドンドンとデータを取っていくのはお奨めしません。効率的にビデオを使うコツとして、(1)大事そうなところだけビデオで撮る、(2)ビデオを連続でとっておき、詳細に分析する必要がある時間帯をフィールドノートに記録しておく、などが考えられます。

その際、腕時計、ビデオ、その他の機器(GPSなど)の時刻を合わせておきましょう。これが異なると、あとで時間が合わなくて苦労します。

予備的な観察、エソグラム
まずは研究対象の動物の行動パターンをよく知る必要があります。ある種が行う行動の目録をエソグラムethogramといいますが、研究対象のエソグラムをしっかりと理解できてから、正式な行動観察を行うことが奨励されます。具体的には、観察を始めても、研究対象の行動パターンに目が慣れるまでに取ったデータはあてにならないので、本データとしては取り扱わずに捨てるべきでしょう。観察をしながら行動パターンを理解し、すべての行動が分かるようになるまでは、ひたすら目をならしましょう。


行動観察法
行動を観察する際には、人為的なバイアスがない方法を取ることが大事です。たとえば、目立つ個体ばかりを観察してしまう、観察しやすい場所だけで観察する、などなど、これらはすべてバイアスを生み出し、データの妥当性(本来取りたいデータがとれているかどうか)が低くなります。以下の観察方法がよく用いられます。
オール・オカランスall occurrence: 観察対象全個体をずっと観察できる場合には、研究対象の全個体を全部記録することができます。または、固定ビデオを使って、すべてを撮ることも可能でしょう。そういう場合には、全部記録するall occurrence法を用いることができます。
個体追跡focal sampling
走査サンプリング
アドリブ

観察項目を決める、行動の操作的 (operational) 定義
行動観察の記録対象を絞り込みましょう。行動のすべてを記録できればいいのですが、「呼吸した」とか「指を動かした」など、研究テーマと関係のない行動も動物はたくさんするでしょう。そのため、重要そうで、研究に関係しそうな行動を一通り選ぶことが大事になります。
行動のなかには、定義をすることが難しい行動や、行動のバウトbout(回数)の定義が難しいことがよくあります。そのような場合、行動の定義を操作的に決めてやる必要があります。たとえば、AとBの間に攻撃が起きて、その1分後に、再度攻撃が起きたとします。このとき、攻撃は一回起きたと数えますか? それとも二回起きたと数えますか? たとえば、「30秒以上たってから、攻撃が再発したらば、それは別の攻撃と数える」などのように行動を人為的に定義してやる必要があります。

データ

データをいじっていて、「メンドクサイ」「この作業、何時間かかるんだ」と感じたら、もっといい方法がある可能性があります。他の人に相談してみましょう。メンドクサイことはコンピューターにやってもらう、という姿勢が重要です。それに、Excelを使ってデータを整理すると人為的なミスをしてしまう可能性があるので、手作業はできるだけ避けるべきです。
Excelの機能のうち、並び替え、フィルター、ピボットテーブル、データ分析の4つがあれば、Rに読み込ませるためのデータ作成や、簡単な図表の作成ができます。ですので、この三つは覚えておきましょう。
「データが多量にあって扱うのが大変」「手作業では間違いそう」「10日かけて手作業で、データを整理したのに、間違いが見つかってやりなおさなくてはいけない」。これらの悩みは、多くの大学院生が直面するものでしょう。データを効率的に扱うために、Rのプログラミングを覚えてみませんか?
まず、最終的に分析するデータの形を思い浮かべましょう。そのデータを作るために、Rでデータをいじっていきます。
プログラミングは慣れないと難しいでしょうが、慣れてしまえば「やってよかった」と思えるものです。データをいじるという目的であったらば、
for (i in 1:n)
if else
while
さえ、使いこなせれば、あとはなんとかなります。
近年のAIの発展によって、Rのコードを書くことがとても楽になりました。ただし、AIが出してくるコードを鵜呑みにしてはいけません。必ずコードを丹念にチェックして、コードの途中結果を出力させたりして、変なコードになっていないかを確かめてください。

統計

本グループでは、フリーソフト「R」を統計の共通語としています。生物統計学の授業や、さまざまな研究場面において、Rを使う機会があると思いますので、各自のパソコンにダウンロードしておくといいでしょう。また、RはRstudioで使うのが便利だと思います。
「R」は生態学をはじめ、多くの研究分野においてひろく用いられています。「R」の優れた点として、「パッケージ」「ライブラリ」を追加していくことによって、高度な統計を行うことができることがあげられます。また、インターネット上に、優れた教材が多数存在します(全部タダ!)。「R」を扱うためには、いくつかのコマンドを覚えなくてはいけません。これらは面倒ですが、挑戦してみてください。操作面を考えると、GUI(マウスでカチカチとボタンを押すだけで操作できる形式)であるSPSSやJMPなどの統計ソフトのほうが初心者にとっては入りやすいと思います。しかし、これらのソフトは高額(数万)です。「R」にもRコマンダー(Rcmdr)というGUI化するライブラリが存在します。

(以下、実習書からの抜粋) 統計ソフト「R」について 実際の生物は複雑極まりない研究対象ですが、研究において分析をする際には、単純な数値・データに置き換えることが必要になります。その際、数値データの羅列から、なにかしらのパターンを発見する統計statisticsが必要となります。ここでは、統計ソフト「R」を用いて、収集データのまとめ方を解説します。 仮説検証と統計の基礎の基礎 課題:興味をもったテーマを見つけて、仮説を立てて、データを集めて、分析してみよう。 Q 仮説・予測はなんだろうか? Q 応答要因response term(研究者が興味をもっている変数、Yにあたる)はなんだろうか? 説明要因explanatory term(応答変数に影響を及ぼしているかもしれない変数、Xにあたる)はなんだろうか? Q 応答要因、説明要因は連続変数(数値;0, 1, 2 …)? カテゴリカル変数(数値;オス/メス、いる/いない)? Q P値 (p value)とは? 否定したい仮説(帰無仮説null hypothesis)が正しいと仮定したときに、手元にあるデータを得る確率 例:帰無仮説:「寄生されているヤドカリと寄生されていないヤドカリでは、体長に差がない」 → 応答変数=体長(連続)、説明変数=寄生されているか、されていないか(カテゴリカル) → p=0.01であったらば、寄生は関係ない、という仮定のもとで、現在手元にあるデータを得る確率は1% → であったらば、偶然でデータが得られる確率は小さい → 帰無仮説を棄却!→結論:寄生されている個体が寄生されていない個体よりも大きい(または小さい) エクセルを使いこなそう データを取ったけど、どうやって管理すればいいの? × シートを増やしていく ・・・データが増えてくると、いずれ破綻します。 ○ 一つのシートを縦に長く使いましょう。 以下のようなデータをExcelで作ること 1行目:変数名を半角英数で書きます。変数名に空欄があってはいけません。たとえば、「body size」は×です。body_sizeのように、アンダーバーなどをうまく使いましょう。 大文字と小文字は別物です。たとえば、Maleとmaleは別のものとして処理されてしまいます。統一しましょう。 データがない場合(観察しなかった、よく分らなかった)には、「NA」と書きましょう(not availableの略)。 データを保存する際には、「名前を付けて保存」→「ファイルの種類」で「csv(カンマ区切り)」形式を選びましょう。 またファイル名は、半角英数字にしましょう(例:rinkai.csv)。 この形式だと、Rにもすぐに読み込めます。 例として、実際のデータ例を添付します。

Rの使い方

Rを開く Windowsの場合、「ファイル>ディレクトリの変更」を選んで、「ブラウズ」によって、ファイルが置いてある箇所を指定する(例:デスクトップにファイルが置いてあったらば、デスクトップを指定する) 以下のように打ち込む。 data <- read.csv(“rinkai.csv”, T) #dataという名前に、rinkai.csvを読み込む(Tはおまじないのようなものと考えて) または、Rを開いたのち、data <- read.csv(" までうって、その後は読み込みたいファイルをドラッグ&ドロップすると、ディレクトリの変更をしなくともファイルを指定することができる。あとは、")を足せばいい。 attach(data) #dataを使うぞ、という宣言 names(data) #dataに含まれる変数名をチェック(飛ばしてもいい) チェックポイント:データの1行目の変数名が出ますか? でていたらば、データの読み込みに成功しています。では分析に進みましょう! 変数の影響を調べよう ・ 一般線形モデルgeneral linear model(GLM)をやろう ・ 応答要因と説明要因のあいだの関係を調べることができる統計手法 ・ 書き方 model <-glm(y~x, data=data) # xには説明要因の変数名、yには応答要因の変数名を書く。 # 意味: model という「箱」に結果を入れる summary(model) #modelの中身をみる 結果の解釈 初学者は、EstimateとP値に注目しましょう。 Intercept(切片のこと、0と異なるかどうか)と説明要因に関して、 Estimate これが変数間の関係を示す(+だったらば正の関係、-だったらば負の関係) (Std. Error Estimateの値の標準誤差) (t や z EstimateとStd. Errorから算出される統計量) P 統計量と自由度から算出されるP値 が表示されます。 注: P値によって「違いがある・ない」「関係している・していない」と結論を導く考え方(帰無仮説検定)は統計の一つの考え方に過ぎず、かねてより、さまざまな批判があります(たとえば、P値が6%であったらば、どのように考えればいいのでしょうか?)。 帰無仮説検定の他にも、赤池情報量基準(AIC)に基づいたモデル選択や、その他のさまざまな統計の考え方が存在します。統計に慣れる入口として、P値に一喜一憂する帰無仮説検定の考え方を学ぶのはいいのですが、その他にもいろいろな考え方があるということを頭の隅に置いておいてください 一般/一般化線形混合モデル(GLMM)について Rでは、一般線形混合モデル(正規分布)は、nlmeライブラリーのlme、一般化線形混合モデル(binomial, poisson分布)に関しては、lme4ライブラリーのlmerがおススメです。 lmerの使い方について lmerは、P値を表示してくれないという鬼のような性質を持っています。簡単に説明します。 model1 <- lmer(y~x+(1|id), data=all_data, family=poisson) という分析をしたとします。これは、yという従属変数に対して、xという独立要因が影響しているかどうか、を、all_dataというデータを使って、誤差構造をポアソン分布としてGLMMによって分析しています。 しかし、この結果は、t値を表示しますが、P値を表示してくれません。でも、論文には、P値を書きたいし、という場合には、どうしたらいいの! とパニックになりますが、少しトリッキーなことをしなくてはいけません。 そのためには、新しいmodel2というものを作ります。 model2 <- lmer(y~1+(1|id), data=all_data, family=poisson) このモデルにはxが入っていないのに注意してください。「1」とは、切片だけ、という意味で、要するに独立要因を入れていないモデル、という意味です。ここから、 anova(model1, model2) をします。これは呪文のようなものだと思ってください。 そうすると、model1(xが入っている結果)とmodel2(xが入っていない結果)を比較したときのモデルのあてはまりの良さが統計的に意味があるかどうか、というP値が出てきます。換言すると、もしもxがyに重要な影響を与えているのだとしたらば、xが入ったmodel1は、xが入っていないmodel2よりも、格段に優れているはずです。逆にxがyに影響していない変数であったらば、model1とmodel2を比べてみても、どんぐりの背比べ、ということで、P値は大きくなるでしょう。つまり、このP値はいいかえると、変数xの影響に関するP値に他なりません。

読む

目安として、毎日、6000 words(=論文一本)を読んで、200 words(=30日で論文一本、計算上は)を書くようにしましょう。
テーマを探すとき、またはテーマが決まったらば、先行研究を調べてみて、「何がやられているか」「何がやられていないか」「どういう手法が使えそうか」などを考えてみましょう。
英語論文の検索はいろいろなサイトでできますが、Google Scholarでだいたい事足ります。いくつかキーワードを入れて、検索してみましょう。
興味がある論文があったらば、その論文を引用している論文、その論文のなかで引用されていて気になる論文も読んでみましょう。また、「ストーカー読み」をすることもとても勉強になります。これは、ある研究者が発表した論文を全部読む方法です。そうすると、「このひとはこの研究のつぎにこういう研究を発展させたのか」「この研究とこの研究は同時にやったのか」などということが分ると思います。
最近では、個人の研究者が自分のサイトに論文のpdfファイルを置いてあることが多くなっています。これもgoogle scholarで探してみましょう。
英語論文を読むと聞いただけで、震え上がる学生さんもいると思います。最初は誰しも、早く正確に読めません。「習うより慣れろ」ということで、毎日、少しずつでも、短い論文でも、読む訓練をすれば、いずれすいすいと読めるようになります。
また、論文を批判的に読むことを忘れないようにしましょう。理論的におかしいところはないか、妥当な方法でデータが集められているか、などなど。
よく読む雑誌が決まってきたらば、雑誌のcontent alertに登録しましょう。「こんな論文が出たよ」とメールで教えてくれます。
また、論文の紹介記事や要約では、論文を読んだということにはなりません。コスパが悪いと感じるかもしれませんが、一文一文を丁寧に読む作業を続けないと、論文の内容を正確に把握したり、論文を書けるようになったりはしないでしょう。

書く

基本的に、大学院生・研究員が自力で論文を書くことを期待しています。その際は、自分のキャパを出し切ったと思えるものを提出するように心がけてください 提出する前には、必ず、全文、音読をしてから提出してください。原稿を他人に読んでもらうときには、その人があなたのために時間をとってくれることを意識してください。共著者の場合であってもです。 ただし、「もっとできる」「もっとできる」と思って、締め切りが近いのに提出しないよりも、90%の力が出せたものを提出してもらうほうが大事です。SOSは早めに出す習慣を持つとお互いに楽です。 僕とのやりとりが始まったらば、変更履歴を使いましょう。僕が手を入れたところに賛成であれば「承諾」してください。 論文投稿後、reviseの場合には、「承諾後」直したところにマーカーで色をつけておくといいでしょう。そうすると、どこをいじって、どこをいじっていないかがよくわかるので。

口頭発表

学内のプログレス発表、学会の予行演習など、事前練習をする前に、以下のチェックリストを眺めてみてください。スライドのデザインなどを指摘するので、貴重な時間を消費するのは、皆にとって損だし、内容について議論ができないという意味では、発表者が一番、損をします。
スライドが見にくくないか? 「デザインが悪くとも、データ・内容がよければいい」という考えはエゴです。凝ったデザインにする必要はありませんが、デザインも最低限のものを作るように意識してください。いいデザインのスライドを作るためには、日頃から審美眼を鍛えてください。
文字は十分に大きいか? 原則、最低18ポイント。グラフの軸の説明まで、このサイズであることが望ましい。
誤字脱字はないか。文章であれば、主語述語があるか。完璧な英語を書く必要はありませんが、それでも細心の注意で言葉を選んでください。これも「内容・データがよければ、あとは適当でいい」という考えはエゴです。
各スライドで、何を言いたいかを明確に。よくある悪例は、スライド上部のタイトル部分に「⚪︎⚪︎⚪︎の影響」、スライド一番下に結論、という形式です。結論を伝えたいのだから、結論は一番見やすい最上部にあるといいでしょう。
口頭発表は、自分の考えをまとめて他人に聞いてもらう、また他の人から一斉に意見をもらえる貴重な機会です。しかし、
スライドがみにくい
文字・記号の使い方が変
必要な情報を載せていない
などのことがあると、発表の仕方を指導するだけで、内容に入ることができません。
ですので、プログレス発表、ゼミ発表をする際には、事前に以下のことをチェックしてください。
・10行以上禁止
・文字は最低18pt
・グラフの横軸・縦軸がない・読めないの禁止
・混んだ部屋で発表するときには、スライドの下1/5は基本的に使わない
・スライドの上部が一番、目立つ場所。ここを無駄に使わない。たとえば、結論は上部に書くと内容が締まる
・フォントは全部一緒?
・変な空白の開け方はしていない?
・エラーバーがSEかSDか、書かれている?
・サンプルサイズは書かれている?
・スライドのデザインは整理されている?
・「;」「:」の使い方はあっている?
・デザイン・イラストに凝りすぎていないか?
英語で発表する際には、原稿を必ず作ってください。その後、手を入れて論文化する手間が省けます
仮説と予測はなんですか? 発表で答えようとしている問いは何ですか? これらをはっきりさせてください。

質疑応答

以下を意識するだけで、メリハリの聞いた議論になります。
ひとつの単語が意味するものが曖昧。言い切る勇気を。
自然淘汰的なもの・・・×
自然淘汰とかぁ・・・×
自然淘汰・・・○
ある言葉を説明する際、例を用いることは可能ですが、例自体は説明になっていません。その例を含む、一般的な定義を説明する事が必要です。

Q 「自然淘汰を説明してください」
A 「ダーウィンフィンチでは、、、」・・・×
A 「自然淘汰とは、、、(説明)。その例として、ダーウィンフィンチが、、、」・・・○

Yes / No で答えるべき質問に、Yes / Noで答えない。
Q 「実験で、この要因はコントロールしましたか?」
A 「コントロールをすべきだとは言われています」・・・×
A 「しました」、または、「していません」・・・○
「で、したのしていないの?」と、再度、聞かれるかもしれません。

統計を使ったときに、なんでも「有意差」といってしまいがちです。でも、相関や回帰の場合には、「差」はありませんよね? 正しい言葉を使えるように気をつけたいものです。
なんでも「有意差」 という
有意な(正の・負の)関係
有意差
要因がどのように影響しているのか、正に効いているのか、負に効いているのか、A>BなのかB>Aなのか。あいまいさをなくす努力が必要。
「分析の結果、この要因が影響していました」・・・×
分析の結果、この要因が正に(負に)影響していました。・・・○