機械学習というと、工場で働くために受けなければならない科目のように聞こえるかもしれないが、コンピューターにおいては人工知能(AI)のサブセットである。一言で言えば、システムが経験やデータから学習することでパフォーマンスを向上させるものだ。AIのサブセットは現代のソフトウェアに非常に深く浸透しており、私たちが当たり前のように使っている既存のテクノロジーの多くは、AIなしでは成り立たなかっただろう。
機械学習とは何なのか?
では、機械学習(ML)とは一体何なのだろうか?MLはAIの応用であり、システムが経験、データ、アルゴリズムから学習して精度を高めることを可能にするコンピューターサイエンスの一分野である。興味深いことに、開発者はMLを活用するためにマシンを明示的にプログラムする必要はない。
チャットボット、バーチャルアシスタント、プロアクティブ・アンチウイルスソフトウェアなどの最新テクノロジーは、機械学習に大きく依存している。例えば、自動運転車は、人間と同等かそれ以上に運転するために取るべき行動を決定するために、教師あり学習モデルと教師なし学習モデルの両方に基づく複数のMLアルゴリズムを使用している。
同様に、EDR(Endpoint Detection and Response)のような企業向けのサイバーセキュリティは、機械学習を利用して未知のマルウェアを検出し、悪意のあるパターンを特定することで未知の「ゼロデイ」脅威を見つけることができる。これは、機械学習が将来サイバーセキュリティにどのような影響を与えるかに関する氷山の一角に過ぎない。
MLとAIはまた、人間の介入なしに機械同士のコミュニケーションを可能にする。このようなマシン・ツー・マシン(M2M)アプリケーションは、サプライチェーンや倉庫管理システムが在庫を効率的に追跡・監視するのに役立つ。同様に、M2Mアプリケーションは、エネルギーハーベスティング源からの収集データを分析用に遠隔地のコンピューターに送信することで、エネルギー企業がより正確に供給を管理するのに役立つ。
一般的な機械学習の方法にはどのようなものがあるか?
教師あり機械学習
教師あり学習とは、ラベル付けされたデータセットがスーパーバイザーの下でアルゴリズムを学習することである。教師ありデータは他の学習方法よりも効率的であるため、一般的である。このタイプのMLの例としては、アルゴリズムがあなたの受信箱にあるスパムを分類することができる。
教師なし機械学習
教師なし学習とは、アルゴリズムが教師なしでラベルのないデータを扱うことである。どのように情報を処理するかは、アルゴリズム自身が決定しなければならない。研究者は教師なし学習を使用することで、ラベル付けされていないデータセットのパターンやデータのグループ化を、介入することなく見つけることができる。もちろん、データ分析者は教師なし機械学習の推奨を検証する必要があるかもしれない。
半教師付き機械学習
半教師あり学習は、ラベル付けされたデータとラベル付けされていないデータを使ってアルゴリズムを学習することで、教師あり学習と教師なし学習のバランスをとる。通常、ラベル付けされたデータ量は少なく、ラベル付けされていないデータ量ははるかに多い。半教師あり学習の応用例として、病院では、放射線科医が少数のスキャン画像に病気のラベルを付けることで、機械がより大量のデータから関連情報を正確に抽出できるようにしている。
強化機械学習
強化学習は教師あり学習に似ているが、アルゴリズムがサンプルデータの代わりに試行錯誤と遅延報酬を通じて学習する点が異なる。例えば、自律走行車は、訓練環境での失敗を通じて、どのような判断が望ましくないかを学ぶことができる。同様に、医療システムは、過去の経験から最適な方針を決定するために使用することができる。
AIと機械学習の違いとは?
AIと機械学習について調べていると、この2つの用語を誤って使い分けている人がいることに気づくかもしれない。AIは基本的に合成知能の総称である。一方、機械学習はAIに焦点を当てたもので、誰かがプログラミングしたり支援したりすることなく、機械が経験やデータから学習することを可能にする。AIを使用する機械は、必ずしもML機能を備えているとは限らない。例えば、1996年、IBMのチェス対局システム「ディープ・ブルー」は、AIを多用し、MLはあまり使わず、無数の手をリアルタイムで評価することで、ロシアのグランドマスター、ガルリ・カスパロフを打ち負かした。
機械学習はどのような産業で使われているのか?
- 政府は大量のデータを分析することで、公共事業、公共安全、不正検知、国境管理などに機械学習を利用している。
- ヘルスケア企業は機械学習を利用して診断や治療を強化し、正確な健康監視装置を開発している。
- 小売企業は、顧客の購買パターンを分析することで、ターゲットを絞ったマーケティング目標を強化することができる。
- エネルギー部門は、機械学習アルゴリズムでより効率的にソースを見つける。
- 宅配業者、ライドシェア事業者、公共交通機関など、運輸部門の多くの企業は、サービス、収益性、二酸化炭素排出量削減を改善するために、理想的なルートを見つけるためにコンピューターを利用している。
- 金融業界では、サイバーセキュリティと不可欠なデータ洞察力を強化するために機械学習が利用されている。
Netflixは機械学習を使っているのか?
そう、ネットフリックスはMLや複数のアプリケーションを使っている。最も明白なもののひとつは、コンテンツ推薦システムだ。このシステムはMLを使って、あなたのジャンルの好み、視聴履歴、そして同じような考えを持つユーザーの視聴履歴を調べ、あなたがどんな映画、フィルム、ドキュメンタリーを試せるかを提案する。