2章 卒論=技術文章の書き方 (5)
このページの要約
2.3 → フォーマットに合わせろ!!
2.4 → 「確率と統計」復習しとけ!!
2.3 論文のフォーマット
2.3.1 全角文字と半角文字
- 文字やカッコ、句読点→全角で記す
- 欧文表記や式、数字、量記号、変数、単位(カッコを用いる場合はそれも含む)→半角で記す
- 句読点については、卒論集や学術誌が(「,」「.」)もしくは(「、」「。」)のどちらの組み合わせを使っているかを確認して、それに合わせて使用する
2.3.2 数式
- 変数、量記号()→半角イタリック体(斜体)
- 数字、数学記号、単位→半角のローマン体(立体)
- 式と本文でフォントと斜体/立体を統一
例
【式を文中に入れる場合】
抵抗R〔〕に電流I〔A〕が流れるとき、抵抗の端子電圧E〔V〕は、
となる。
【式を一つの文として扱う場合】
試料のヤング率E〔Pa〕を式(2)より求める。
ここで、〔Pa〕は応力、はひずみである。
- 数式で使用する量記号や変数は、必ず本文で説明してください
- 数式の配置は、論文集のフォーマット(本文中央揃えもしくは左インデント)に合わせる
- 数式には、(1)のように式番号を示す
- 本文で式に言及するときは「式(1)」
2.3.3 数値と単位の表記
[1] 単位
ダメな例
【×】気温摂氏20度, 湿度80%, 向かい風5〔m/s〕でのドローンの最高速度は20Km/hであった。
正解例
【○】気温20℃, 湿度80%, 向かい風5m/sでのドローンの最高速度は20km/hであった。
- 単位は、本文、式ともに国際単位系(SI)および例外単位(JIS Z 8203:2000に規定)を用いる
- 数字と単位は別の単語扱いなので、間にスペースを挿入する(例:3␣km)
- 単位は1つの単語扱いなのでスペースを空けない(例:kg/㎡)
- 割り算を含む単位は、研究分野の流儀に従う(「m/s」or「m・」)
- 時間のSI単位は「s」だが、例外単位の「h」や「min」の使用も認められている
- 接頭語(k:など)は小文字
[2] 単位のカッコ
- 発表する論文誌のフォーマットに合わせる
- 国際規格 ISO 80000 では、数値に続く単位にカッコをつけない
- 学術誌や書籍にはそれぞれの流儀があるので紹介する
学術誌、書籍 | 流儀 |
---|---|
文部科学省検定 | 量単位(変数)の後の単位はf〔Hz〕のように亀甲カッコ、数値の後はカッコなし |
和文教科書・学術誌 | のようにブラケットで括るものが多い、量記号(変数)だけもしくは数値だけに[ ]を用いるものもある |
欧文教科書・学術誌 | 3kPaのようにカッコなしが一般的、3(kPa)のように丸カッコを用いるものもある |
- 単位にカッコを用いる場合でも%にはつけない
(%は1/100を示しており、記号ではないため)
例
【×】45.6〔%〕
【○】45.6 %
2.3.4 見出し
- 卒論集や学術誌のフォーマットに合わせる
- 番号の全角/半角、数字の後がピリオド/スペースなどを確認する
例
1. タイトル (ゴシック10pt.、行の前を1行空ける)
2.1 タイトル (明朝10pt.)
2.2.1 タイトル (1文字下げて、明朝9pt.)
(1) タイトル (2文字下げて、明朝9pt.)
ここからが本文になります。以下の文章は例文になります。これらの文章のフォーマットは明治大学の卒業論文のフォーマットに合わせてください。卒業論文の中間締め切りは1月19日、卒業論文の最終締め切りは1月31日になります。
(本文、段落の先頭は1文字下げて、明朝9pt.)
2.3.5 フォント・ポイント
- 論文は、本文は基本的に明朝体フォントを使用
- 印刷原稿を作成する際は、投稿規定などを確認して、指定されたフォントを使用する
- フォントの指定がない場合は等幅(とうはば)フォント(それぞれの文字の幅が等しい字体)を用いる (⇔プロポーショナルフォント(文字によって幅が異なる字体))
- 論文において、文字サイズは一般的に9pt.だが、指定されたサイズを使用する
2.4 統計検定
- 2.4.2~2.4.7は数学Bの「確率分布と統計的な推測」や大学の授業の「確率・統計」で扱っている内容です
- これからやる内容を一切覚えていなかった方は、ぜひ高校の頃の教科書で復習してみてください
2.4.1 なぜ統計を用いるのか
- 測定では、アイデアを用いたアイテムがどのような特性になるかを、少ないサンプルから予測することが求められる
→ 統計を活用
2.4.2 母集団とは
(https://bellcurve.jp/statistics/course/8003.html)
2.4.3 平均値だけではわからない
- 差を議論するためには、平均値だけでなくデータのばらつきも考慮しなければならない
この図を見て「平均値が一緒なので差はありません」と言ってしまうと、読者が
という状態になってしまいます。
2.4.4 分散
- データのばらつきは(平均値との差)^2の平均値として表す
- 個の標本をとしたときの分散(標準分散)は、平均(標準平均)値を用いて、
2.4.5 正規分布
- 正規分布:式(2.5)に示される確率密度関数
- ある測定値が出現する確率は、母平均と母分散を用いて、以下のように表される。
- 正規分布の式は複雑 → と示す
(https://unit.aist.go.jp/mcml/rg-orgp/uncertainty_lecture/normal.html)
2.4.6 サンプルから母集団を推定する
- 普通、母集団全てを調査できない → 母平均と母分散を得ることが出来ない
- n個のサンプルから求めた標本平均と標本分散からとを推定
- 標本分散から母分散を推定するため、で割り算した不偏分散を使う
- :自由度
2.4.7 標準偏差
- 標準偏差(=SD、不偏標準偏差):不偏分散の平方根、母集団のばらつきを表す
- ExcelではSTDEV.S()関数を用いて求める(標本標準偏差はSTDEV.P()関数)
- 平均値SDが分かれば、測定値がどのくらいの範囲に分布するのかが大体わかる
(https://unit.aist.go.jp/mcml/rg-orgp/uncertainty_lecture/normal.html)
2.4.8 母集団から取り出したサンプルの平均値
- 正規分布している母集団からn個のサンプルを取り出して平均を取るという作業を、繰り返して得る平均値の集団は、母集団と同じく正規分布する
- このとき、平均値の集団の分散は、母分散をサンプル数nで割った数となる
2.4.9 t分布
- 平均値の集団は、正規分布を示すが、測定時に母分散を知ることはできない →そのため、不偏分散を用いる
- →に正規分布と異なる分布を示す→t分布()
- サンプル数nが大きくなると、t分布は正規分布に近づく
(https://bellcurve.jp/statistics/course/8968.html)
2.4.10 標準誤差
- t分布の分散()の平方根()を
標本平均の標準誤差(=SEM)または標準誤差(=SE)と呼ぶ - ここでの標準誤差は「母平均に対する標本平均の推定精度」
2.4.11 標準偏差と標準誤差
- 工学系論文では、製品の品質を重視するため、「平均値SD」を示すべきであると考える
- 平均値SEでは、母集団のばらつきを示さない
2.4.12 データの比較
- 条件を変えて製作した2種類のアイテムの特性に差があるかどうかは、統計検定を用いて調べる
- 代表的なパラメトリック検定(=母集団がある特定の分布(正規分布など)に従うときに用いられる検定法)はt検定
t検定とは
- 以前(卒論=技術文章の書き方 (3))にやったので
リンクさえも飛びたくない怠惰な人向け
2つの母集団の平均値は等しくないこと()を示したいとき、あえてそれぞれの母集団の平均値は等しい()との仮説を立てる。「差がある」というために「差がない」という仮説を否定(棄却)する(=帰無仮説)。t検定では、二つの平均の差()の出現確率を計算する。これは「差がない」ときの出現確率であるため、 or を有意水準(危険率)として、これをp値が下回った時に帰無仮説が棄却され、「有意な差がある」と見なすことが出来る
2.4.13 t検定の例
- ExcelではT.TEST()関数を用いてt統計量(出現確率)を求める
Excelのt検定について
T.TEST(配列1、配列2、尾部、検定の種類)
- 配列1:対象となる一方のデータ
- 配列2:対象となるもう一方のデータ
- 尾部(1:片側分布、2:両側分布):通常は2、どちらか一方が大きくなることが分かっているときは1
- 検定の種類(1:対をなすデータ、2:等分散の2標本、3:非等分散の2標本):通常は3、1は処理・加工を施す前後を比較するとき、3は等分散検査をしていないとき
2.4.14 サンプル数について
- 厳密にいえば、やりながら例数を決めるのはデータのねつ造である
- 測定に要する時間・費用・労力が許すなら10例、いずれかが足りないなら6~7例と、決めた例数を測定してから検定を行うべき
2.4.15 2値変数の比較 (カイ2乗検定)
- 成功/失敗などの2値変数を比較する場合 → (カイ2乗)検定を用いる
例題
顔認証アルゴリズムAとBがあり、各成功率の差が9%であった。
-
ここでも、AとBの成功率の差が偶然生じたと考えて「成功率が等しい」という帰無仮説を用いる
-
Excelを使って 統計値が偶然に発生する確率を計算する場合
→ CHISQ.TEST(実測値範囲, 期待値範囲)関数を用いる -
計算された統計値(=p値)が有意水準を下回れば、帰無仮説が棄却される
-
有意水準を上回り、帰無仮説が棄却されなかった場合
→「p=0.063であり、有意差はみられなかった」のように記す - (カイ2乗)検定の場合、試行回数が多ければ、成功率は同じでもp値は下がる
2.4.16 3グループ以上の比較
- 今まで説明してきたt検定、検定はどちらも2グループの比較
- t検定、検定を3つのグループの比較に使用しようとすると帰無仮説の検出率が低下する
- そのため、3グループ以上の比較ではANOVAなどの多変量解析手法を用いる
2.4.17 その他
- 論文に標準偏差を示すとき、標準誤差と混同しないように、以下のように何を示すのかを明記する
例
測定値は、平均値標準偏差(SD)として示す。
- 平均値SDでは、平均値と同じ桁までか1桁下までのSDを示す
例
12.34.5 or 12.34.56
- 統計検定を用いた時には、p値をp=0.0049のように2桁の有効数字として示す
- 有意水準はp<0.050あるいはp<0.010のどちらかを用い、論文中では同じ水準を用いる
- 小さなp値を得たからといって、p<0.0001のように勝手な値を使ってはいけない
- 論文に記述する際、有意水準とp値を混同させた記述を用いないようにする
例
【×】 0.49%の有意差を認めた。
【○】 p=0.0049であり有意差を認めた。