機械学習

機械学習

交差検証(クロスバリデーション)とは?最終的にどう評価すればいいの?

この記事では、交差検証(クロスバリデーション)について解説しています。交差検証は、機械学習モデルの性能を正しくはかるために必須の知識です。どんなに機械学習をまなんでも、性能が上がったのかどうか評価できなければ、意味がありません。交差検証のや...
機械学習

過学習(オーバーフィッティング)とは?原因から防止策まで【機械学習ガイド】

過学習(オーバーフィッティング)は、機械学習でよく直面する問題です。機械学習でもっとも気を付けなければいけないポイントです。本記事では、過学習の基本、原因、具体例、そして防止策について詳しく解説します。過学習とは?過学習とは、機械学習モデル...
機械学習

正規化と標準化の違いとは?【データ前処理の基礎知識】

データ分析や機械学習では、「正規化」「標準化」はよく使われます。本記事では、それらの手法を解説し、それぞれの適用シーンやメリット・デメリットについて掘り下げていきます。正規化とは?正規化は、データのスケールを統一する手法です。具体的には、デ...
機械学習

ロジスティック回帰の仕組みと応用例を初心者向けに解説!【オッズ・オッズ比】

線形回帰とは何が違う?ロジスティック回帰とはロジスティック回帰とは、「メールがスパムかどうか」「商品が不良品かどうか」「顧客が商品を買ってくれるかどうか」など、0か1かを判断するモデルです。これらは二値分類とよばれていて、ロジスティック回帰...
機械学習

ROC曲線とAUCをわかりやすく解説【機械学習の評価指標】

ROC曲線の基礎ROC曲線とは、機械学習の二値分類の良さをグラフで表したものです。二値分類とは、病気にかかっているか、製品が不良品かどうか、など0または1に分類できる問題のことです。二値分類モデルとしては、ロジスティック回帰が有名で、次の記...
機械学習

混同行列の見方を分かりやすく解説!【正解率・適合率・再現率・F1スコア】

混同行列とは混同行列(Confusion Matrix)は、機械学習の二値分類の性能をはかるために使われます。二値分類とは、Yes/Noで表すことのできる問題で、ビジネスでは下記のような例があります。医療診断で、病気にかかっているかどうかを...