コンテンツにスキップ

2章 卒論=技術文章の書き方 (5)

このページの要約

2.3 →  フォーマットに合わせろ!!
2.4 → 「確率と統計」復習しとけ!!

2.3 論文のフォーマット

2.3.1 全角文字と半角文字

  • 文字やカッコ、句読点全角で記す
  • 欧文表記や式、数字、量記号、変数、単位(カッコを用いる場合はそれも含む)半角で記す

  • 句読点については、卒論集や学術誌が(「,」「.」)もしくは(「、」「。」)のどちらの組み合わせを使っているかを確認して、それに合わせて使用する

2.3.2 数式

  • 変数、量記号(α,β,γ,t,f,m,F\alpha , \beta , \gamma , t, f, m, F)→半角イタリック体(斜体)
  • 数字、数学記号、単位→半角のローマン体(立体)
  • 式と本文でフォントと斜体/立体を統一

【式を文中に入れる場合】
抵抗RΩ\Omega〕に電流I〔A〕が流れるとき、抵抗の端子電圧E〔V〕は、

E=IR(1) E=IR \tag{1}

となる。

【式を一つの文として扱う場合】
試料のヤング率E〔Pa〕を式(2)より求める。

E=σϵ(2) E=\frac{\sigma}{\epsilon} \tag{2}

ここで、σ\sigma〔Pa〕は応力、ϵ\epsilonはひずみである。

  • 数式で使用する量記号や変数は、必ず本文で説明してください
  • 数式の配置は、論文集のフォーマット(本文中央揃えもしくは左インデント)に合わせる
  • 数式には、(1)のように式番号を示す
  • 本文で式に言及するときは「式(1)」

2.3.3 数値と単位の表記

[1] 単位

ダメな例

【×】気温摂氏20度, 湿度80%, 向かい風5〔m/s〕でのドローンの最高速度は20Km/hであった。

thinking time

正解例
【○】気温20℃, 湿度80%, 向かい風5m/sでのドローンの最高速度は20km/hであった。
 
  • 単位は、本文、式ともに国際単位系(SI)および例外単位(JIS Z 8203:2000に規定)を用いる
  • 数字と単位は別の単語扱いなので、間にスペースを挿入する(例:3␣km)
  • 単位は1つの単語扱いなのでスペースを空けない(例:kg/㎡)

  • 割り算を含む単位は、研究分野の流儀に従う(「m/s」or「m・s1s^{-1}」)
  • 時間のSI単位は「s」だが、例外単位の「h」や「min」の使用も認められている
  • 接頭語(k:10310^3など)は小文字

[2] 単位のカッコ

  • 発表する論文誌のフォーマットに合わせる
    • 国際規格 ISO 80000 では、数値に続く単位にカッコをつけない
    • 学術誌や書籍にはそれぞれの流儀があるので紹介する
学術誌、書籍 流儀
文部科学省検定 量単位(変数)の後の単位はf〔Hz〕のように亀甲カッコ、数値の後はカッコなし
和文教科書・学術誌 F[N],3[m]F[N], 3[m]のようにブラケットで括るものが多い、量記号(変数)だけもしくは数値だけに[ ]を用いるものもある
欧文教科書・学術誌 3kPaのようにカッコなしが一般的、3(kPa)のように丸カッコを用いるものもある
  • 単位にカッコを用いる場合でも%にはつけない
    (%は1/100を示しており、記号ではないため)

【×】45.6〔%〕
【○】45.6 %

2.3.4 見出し

  • 卒論集や学術誌のフォーマットに合わせる
  • 番号の全角/半角、数字の後がピリオド/スペースなどを確認する

1. タイトル (ゴシック10pt.、行の前を1行空ける)
2.1 タイトル (明朝10pt.)
 2.2.1 タイトル (1文字下げて、明朝9pt.)
  (1) タイトル (2文字下げて、明朝9pt.)
 ここからが本文になります。以下の文章は例文になります。これらの文章のフォーマットは明治大学の卒業論文のフォーマットに合わせてください。卒業論文の中間締め切りは1月19日、卒業論文の最終締め切りは1月31日になります。
(本文、段落の先頭は1文字下げて、明朝9pt.)

2.3.5 フォント・ポイント

  • 論文は、本文は基本的に明朝体フォントを使用
  • 印刷原稿を作成する際は、投稿規定などを確認して、指定されたフォントを使用する
  • フォントの指定がない場合は等幅(とうはば)フォント(それぞれの文字の幅が等しい字体)を用いる (⇔プロポーショナルフォント(文字によって幅が異なる字体))
  • 論文において、文字サイズは一般的に9pt.だが、指定されたサイズを使用する

2.4 統計検定

  • 2.4.2~2.4.7は数学Bの「確率分布と統計的な推測」や大学の授業の「確率・統計」で扱っている内容です
  • これからやる内容を一切覚えていなかった方は、ぜひ高校の頃の教科書で復習してみてください

2.4.1 なぜ統計を用いるのか

  • 測定では、アイデアを用いたアイテムがどのような特性になるかを、少ないサンプルから予測することが求められる
    → 統計を活用

2.4.2 母集団とは

母集団とサンプルのイメージ図

(https://bellcurve.jp/statistics/course/8003.html)

2.4.3 平均値だけではわからない

  • 差を議論するためには、平均値だけでなくデータのばらつきも考慮しなければならない

散らばりが小さいグラフ 散らばりが大きいグラフ

この図を見て「平均値が一緒なので差はありません」と言ってしまうと、読者が

お前は何を言っているんだ

という状態になってしまいます。

2.4.4 分散

  • データのばらつきは(平均値との差)^2の平均値として表す
  • nn個の標本をxi,,xnx_i, \cdots ,x_nとしたときの分散(標準分散)s2s^2は、平均(標準平均)値XmX_mを用いて、

Xm=x1+x2++xnn=1ni=1nxi(2.3) X_m = \frac{x_1 + x_2 + \cdots + x_n}{n} = \frac{1}{n} \sum^{n}_{i=1} x_i \tag{2.3}

s2=(x1Xm)2+(x2Xm)2++(xnXm)2n=1ni=1n(xiXm)2(2.4) s^2 = \frac{(x_1 - X_m)^2 + (x_2 - X_m)^2 + \cdots + (x_n - X_m)^2}{n} = \frac{1}{n} \sum^{n}_{i=1} (x_i - X_m)^2 \tag{2.4}

2.4.5 正規分布

  • 正規分布:式(2.5)に示される確率密度関数
  • ある測定値xxが出現する確率は、母平均μ\muと母分散σ2\sigma ^ 2を用いて、以下のように表される。

f(x)=12πσexp=((xμ)22σ2)  (<x<)(2.5) f(x) = \frac{1}{\sqrt{2\pi\sigma}exp} = (-\frac{(x-\mu)^2}{2\sigma^2})  (-\infty < x < \infty) \tag{2.5}

  • 正規分布の式は複雑 → N(μ,σ2)N(\mu, \sigma^2)と示す

正規分布の図

(https://unit.aist.go.jp/mcml/rg-orgp/uncertainty_lecture/normal.html)

2.4.6 サンプルから母集団を推定する

  • 普通、母集団全てを調査できない → 母平均μ\muと母分散σ2\sigma ^ 2を得ることが出来ない
  • n個のサンプルから求めた標本平均XmX_mと標本分散s2s^2からμ\muσ2\sigma ^ 2を推定
  • 標本分散から母分散を推定するため、n1n-1で割り算した不偏分散u2u^2を使う

u2=1n1i=1n(xiXm)2 (2.6) u^2 = \frac{1}{n-1} \sum ^{n}_{i=1}(x_i - X_m)^2 \tag{2.6}

  • n1n-1:自由度

2.4.7 標準偏差

  • 標準偏差(=SD、不偏標準偏差uu):不偏分散u2u^2の平方根、母集団のばらつきを表す

SD=u=1n1i=1n(xiXm)2 (2.7) SD = u = \sqrt{\frac{1}{n-1} \sum ^{n}_{i=1}(x_i - X_m)^2} \tag{2.7}

  • ExcelではSTDEV.S()関数を用いて求める(標本標準偏差はSTDEV.P()関数)
  • 平均値±\plusmnSDが分かれば、測定値がどのくらいの範囲に分布するのかが大体わかる

正規分布の図

(https://unit.aist.go.jp/mcml/rg-orgp/uncertainty_lecture/normal.html)

2.4.8 母集団から取り出したサンプルの平均値

  • 正規分布している母集団からn個のサンプルを取り出して平均を取るという作業を、繰り返して得る平均値の集団は、母集団と同じく正規分布する
  • このとき、平均値の集団の分散は、母分散σ2\sigma ^ 2をサンプル数nで割った数となる

2.4.9 t分布

  • 平均値の集団は、正規分布N(μ,σ2/n)N(\mu, \sigma^2/n)を示すが、測定時に母分散σ2\sigma ^ 2を知ることはできない →そのため、不偏分散u2u ^ 2を用いる
  • σ2\sigma^2u2u^2に正規分布と異なる分布を示す→t分布t(μ,u2/n)t(\mu, u^2/n)
  • サンプル数nが大きくなると、t分布は正規分布に近づく

t分布の図

(https://bellcurve.jp/statistics/course/8968.html)

2.4.10 標準誤差

  • t分布の分散(u2/nu^2/n)の平方根(u/nu/\sqrt{n})を
    標本平均の標準誤差(=SEM)または標準誤差(=SE)と呼ぶ
  • ここでの標準誤差は「母平均に対する標本平均の推定精度」

SEM=SE=un(2.8) SEM=SE=\frac{u}{\sqrt{n}} \tag{2.8}

2.4.11 標準偏差と標準誤差

  • 工学系論文では、製品の品質を重視するため、「平均値±\plusmnSD」を示すべきであると考える
  • 平均値±\plusmnSEでは、母集団のばらつきを示さない

2.4.12 データの比較

  • 条件を変えて製作した2種類のアイテムの特性に差があるかどうかは、統計検定を用いて調べる
  • 代表的なパラメトリック検定(=母集団がある特定の分布(正規分布など)に従うときに用いられる検定法)はt検定

t検定とは

割愛

リンクさえも飛びたくない怠惰な人向け 2つの母集団の平均値は等しくないこと(μ1μ2\mu^1 \not ={\mu^2})を示したいとき、あえてそれぞれの母集団の平均値は等しい(μ1=μ2\mu^1 = \mu^2)との仮説を立てる。「差がある」というために「差がない」という仮説を否定(棄却)する(=帰無仮説)。
t検定では、二つの平均の差(Xm1Xm2X_{m1}-X_{m2})の出現確率ppを計算する。これは「差がない」ときの出現確率であるため、p=0.050p=0.050 or p=0,010p=0,010有意水準(危険率)として、これをp値が下回った時に帰無仮説が棄却され、「有意な差がある」と見なすことが出来る

2.4.13 t検定の例

  • ExcelではT.TEST()関数を用いてt統計量(出現確率)を求める

Excelのt検定について

T.TEST(配列1、配列2、尾部、検定の種類)

  • 配列1:対象となる一方のデータ
  • 配列2:対象となるもう一方のデータ
  • 尾部(1:片側分布、2:両側分布):通常は2、どちらか一方が大きくなることが分かっているときは1
  • 検定の種類(1:対をなすデータ、2:等分散の2標本、3:非等分散の2標本):通常は3、1は処理・加工を施す前後を比較するとき、3は等分散検査をしていないとき

2.4.14 サンプル数について

  • 厳密にいえば、やりながら例数を決めるのはデータのねつ造である
  • 測定に要する時間・費用・労力が許すなら10例、いずれかが足りないなら6~7例と、決めた例数を測定してから検定を行うべき

2.4.15 2値変数の比較 (カイ2乗検定)

  • 成功/失敗などの2値変数を比較する場合 → χ2\chi ^ 2(カイ2乗)検定を用いる

例題

顔認証アルゴリズムAとBがあり、各成功率の差が9%であった。

  • ここでも、AとBの成功率の差が偶然生じたと考えて「成功率が等しい」という帰無仮説を用いる

  • Excelを使って χ2\chi ^ 2統計値が偶然に発生する確率を計算する場合
    → CHISQ.TEST(実測値範囲, 期待値範囲)関数を用いる

  • 計算されたχ2\chi ^ 2統計値(=p値)が有意水準を下回れば、帰無仮説が棄却される

  • 有意水準を上回り、帰無仮説が棄却されなかった場合
    →「p=0.063であり、有意差はみられなかった」のように記す

  • χ2\chi ^ 2(カイ2乗)検定の場合、試行回数が多ければ、成功率は同じでもp値は下がる

2.4.16 3グループ以上の比較

  • 今まで説明してきたt検定、χ2\chi ^ 2検定はどちらも2グループの比較
  • t検定、χ2\chi ^ 2検定を3つのグループの比較に使用しようとすると帰無仮説の検出率が低下する
  • そのため、3グループ以上の比較ではANOVAなどの多変量解析手法を用いる

2.4.17 その他

  • 論文に標準偏差を示すとき、標準誤差と混同しないように、以下のように何を示すのかを明記する

測定値は、平均値±\plusmn標準偏差(SD)として示す。


  • 平均値±\plusmnSDでは、平均値と同じ桁までか1桁下までのSDを示す

12.3±\plusmn4.5 or 12.3±\plusmn4.56


  • 統計検定を用いた時には、p値をp=0.0049のように2桁の有効数字として示す
  • 有意水準はp<0.050あるいはp<0.010のどちらかを用い、論文中では同じ水準を用いる
  • 小さなp値を得たからといって、p<0.0001のように勝手な値を使ってはいけない
  • 論文に記述する際、有意水準とp値を混同させた記述を用いないようにする

【×】 0.49%の有意差を認めた。
【○】 p=0.0049であり有意差を認めた。