- HOME >
- しょー
しょー
地方公立大学でデータサイエンスについて学んでいる大学3年生のしょーです。 これまで、大学で学んできたこと、個人的に調べてきた情報を、「大学の先輩」的なポジションから大学生をサポートしたいと考えております。 何か分からないことがあれば、X(Twitter)のDMやブログ内のお問い合わせにてご相談ください。 また、記事作成依頼やサービスの体験依頼も承っております。 お気軽にご相談ください。
過学習は学習のために用いたデータに過度に適合することで、未知のデータに対する予測精度が低くなってしまう現象です。今回の記事では、過学習の原因から見分け方・対策方法まで解説しています。
正則化はモデルの作成の際に過学習を抑えるために用いられる手法です。正則化にはL1正則化とL2正則化が存在しそれぞれ特徴が存在します。今回の記事では、正則化の概要や目的、L1正則化とL2正則化の特徴と実装をご紹介しています。
機械学習の評価指標はモデルの性能を客観的に評価するために重要です。評価の中でも評価指標はモデルの予測精度や性能を定量化するために用いられます。この記事では、回帰タスクと分類タスクにおける代表的な評価指標を図解や数式で解説します。
k近傍法はあるデータを分類するという場面で用いられる手法です。シンプルな仕組みであるため、理解しやすく実装も容易に行えます。今回はk近傍法について、仕組みや実用例、Pythonでの実装、メリット・デメリットについて解説していきます!
情報の信頼性は専門性と信用性から判断できます。今回の記事では、情報の信頼性の定義からインターネットでの信頼性の基準、見分け方について簡単に解説しています。
統計学を勉強する上で必ずつまづく質的変数と量的変数。本記事では、「変数とは何か」というところから質的変数と量的変数の違い、それぞれの尺度の判別方法まで図解を用いて分かりやすく解説していきます!
統計学とは何かについて、記述統計と推測統計についても詳しく解説します。統計学は今話題のデータサイエンスと密接に関係しています。本記事で、統計学についての概観をつかんでください。
Twitterのフォロワー数300人達成を記念して企画を行いました。この記事は、フォロワー様のブログ記事を許可をいただいた上でスクレイピングし、上位5キーワードとワードクラウドを作成しました。さまざまなジャンルの記事がありますのでぜひご覧ください。