【AI 予測活用レポート】AI を活用した予測業務の容易化、高精度化 (Ⅳ) ~ 中堅中小企業における AI 予測の活用 ~
津田 英隆
1977 年 名古屋大学大学院工学研究科応用物理学専攻修士課程修了、同年富士通 (株) 入社。
人工衛星追跡管制システム等の開発に従事。1983 年 ~ 1986 年、現在の国立研究開発法人情報通信研究機構に出向。その後、半導体設計用 CAD システムの開発、統計学を応用した歩留まり解析手法、システムの開発に従事。退職後は、国立研究開発法人科学技術振興機構で情報分析、情報通信研究機構で知財活用を担当。現在は、データ分析に関連した企業支援を行っている。博士 (情報科学)。
近藤洋司
1978 年 早稲田大学理工学部応用物理学科卒業、同年富士通 (株) 入社。
主に金融機関のシステムエンジニア、プロジェクトマネージャー、コンサルタントを担当。システム本部金融デリバリー統括部長、富士通総研金融コンサルティング事業部長に従事。
2010 年 ゆうちょ銀行へ転籍し、システム開発部長に従事。
2020 年 ゆうちょ銀行退職後、㈱シルバーウエア代表取締役
1. 電力需要予測への AI 予測キット FE と Excel(回帰分析) の適用結果と評価
電力需要予測は、電力供給計画、すなわち発電所や関連設備の運転計画作成のための日常的な必須業務である。高精度で予測できれば、発電所や関連設備の稼働を効率的に実行でき、発電コストや環境負荷を低減できる。このことは、大手電力会社だけでなく小売電気事業者にとっても重要であり、電力需要予測精度は収益に直接影響を与える重要な要素である。
電力需要実績値は、数値データとして蓄積されており、カレンダー条件 (季節、休日 / 平日) と気象条件 (気温、湿度、天候等) でおおよそ推定できる。近年、オープンイノベーションの推進が叫ばれ、国内外の学会及び電力会社が、エネルギー分野の予測手法に関するコンテスト (*1) を開催している。開催者情報によると、大部分は機械学習に基づく手法を採用して多種大量のデータを収集し、複雑な方式で高精度の予測を実現している。
しかし、本稿では容易に予測結果が得られるように、電力会社が公開している電力需要実績値と気象庁が公開している気象データから、予測 AI キット FE と Excel の重回帰分析により、日ごとの電力需要予測モデルを作成し、両者の分析のしやすさ、モデル精度を比較、評価する。前半12か月における電力需要データ、気象データとの関連を予測モデルとし、後半 3 か月の日々の気象データを将来データとして予測モデルに入力し、電力需要の予測値を求め、電力需要の予測値と実績値との誤差率のトレンド、および4つの統計指標で予測モデル精度を評価した。
1.1 対象データ
・日付の他に、東京電力パワーグリッド社の H.P.(*2) から電力需要データ、気象庁の H.P. (*3) から気象データをダウンロードした。
・2018.9.1~2019.8.31 間のデータ :学習用データとし、予測モデルを作成する。 365 レコード
・2019.9.1~2019.11.30 間の気象データ:将来データとし、作成した予測モデルに入力して、各日の電力需要予測値を求める。 91 レコード
2019.9.1~2019.11.30 間の電力需要実績値を図1に示す。80000±20000(万kW) 程度で変動している。
1.2 分析手順概要
・電力需要は日付と気象データによるものとし、マスタ学習データ形式を (Ⅲ) の表 1 に示す。
・(Ⅲ) の表 1 で休日とするのは、土日、祝日と電力需要の少ない盆休み、正月休みの各々 4 日、合計 8 日を加えた日とする。
・FE と Excel により、それぞれ学習用データに基づいて電力需要予測モデルを作成し、そのモデルに将来データを入力して各日の電力需要予測値を得る。
・予測モデルの評価指標として、各日の誤差率 =(電力需要予測値-電力需要実績値)/ 電力需要実績値
を求め、そのトレンドを可視化し、平均値、標準偏差を求める。この処理は Excel で行う。
1.3 FE の分析手順
(Ⅲ) の図 2 のフローに従い、各操作はデータ分析知識を殆ど必要とせず、各々 1 クリックで完了する。
a. 全区間のデータをマスター学習データとして、FE にドラッグ & ドロップで入力 ステップ 1 の ③
b. マスター学習データを学習データと将来データに分割 ステップ 2 の ①
c. 予測モデルを作成する。変数として、月から天気概況までの全9変数を採用 ステップ 2 の ②
d. 将来データを予測モデルに入力し、各日の電力需要予測値を算出 ステップ 3 の ①
各日の予測値まで、自動的に算出される。
1.4 Excel(回帰分析) と分析手順
1.4.1 回帰分析
説明変数、目的変数がともに数値データである場合によく適用される分析手法であり、Excel にも標準装備されている。目的変数と目的変数に影響を与えている説明変数の関係を、回帰式として把握する。さらに、得られた回帰式を基に、未来の値を予測することができる。説明変数が複数ある場合には重回帰分析と言う。
1.4.2 分析手順
各操作において、回帰分析の知識と面倒な操作が必要である。
a. 2018.9.1~2019.8.31 間のデータを学習用データ、2019.9.1~2019.11.30 間のデータを将来データとして、別ファイルに分割する。
b. 回帰分析であるので名義変数を使用できないため、(Ⅲ) の表 1 の変数のうち曜日、天気概況を削除する。
c. Excel-> データ > データ分析 -> 分析ツール -> 回帰分析で OK を押す。
d. 目的変数、説明変数の入力範囲等を入力する。
e. 電力需要予測値を求めるため、回帰分析結果である回帰式の係数 (表 1) を取得する。
表 1 回帰分析の実行結果 (回帰式の係数)
f. 各日の電力需要予測値を求める。
計算式、すなわち予測モデル式は、(Ⅲ) の表 1 における各日の変数と表 1 の各係数との積の線型結合であり、電力需要予測値は具体的には (1) 式で計算される、
電力需要予測値 = 90265-496*月-8809* 休日-1341* 最高気温 + 1200*最低気温-86* 降水量の合計 + 25* 平均湿度 + 835* 日照時間 (1)
1.5 予測モデルの精度評価
電力需要のような回帰モデルの精度を評価するための指標として各種のものがあるので、解析目的に応じて使い分ける。電力需要予測では、一般に以下のものが使われる。
・RMSE (Root Mean Squared Error)
大きな誤差(実測値と予測値の差)が生じるサンプルを出来るだけ少なくしたい場合に使用する。予測精度は 0% に近いほど高い。電力会社による電力需要予測コンテストで使用する指標はRMSE とすることが規定 (*4) されているものもある。
yoi:電力需要の実績値、ypi : 電力需要の予測値
・MAPE (Mean Absolute Percentage Error)
実測値と予測値の誤差率(相対誤差)を算出する指標で、予測精度は 0% に近いほど高い。RMSE が誤差の大きさで評価するのに対し、割合で評価する。
・各日の電力需要誤差率 (= (電力需要予測値-電力需要実績値) / 電力需要実績値)
本稿では RMSE、MAPE に加え、各日の電力需要誤差率を求め、そのトレンドグラフ、平均値、標準偏差でも評価する。
1.6 評価結果
1.6.1 1.1のデータによる結果
・AI 予測モデルの精度
FE と Excel により得られた AI 予測モデルの精度評価指標を表 2 に示す。また、誤差率のトレンドグラフを図 2、図 3 に示す。いずれも指標においても、FE による AI 予測モデル (図 2) の方がExcel によるそれ (図 3) に比べて 1 桁以上高精度であり、トレンドグラフにも明らかに差が見られる。図2において、誤差率が4%と他の日に比べて圧倒的に大きく突出しており電力需要の実績値が少なかった 2019 年 10 月 12 日は、降水量の合計 (mm) が 209.5 と全 15 ヶ月を通じて最大で、天気概況は大雨であった。この日に誤差率が大きくなった理由は、台風 19 号の接近により停電が発生した事情による。
・操作性
Excel では分析に関する知識を活用して、めんどうな操作を多く行う必要があるのに対し、FE ではわずかな手順、かつ各々における操作が1クリックで完了する。また、回帰分析であることから、説明変数のうち、名義変数である曜日、天気概況を削除するので精度低下が一般に予想される。
表 2 FE と Excel による予測精度の評価指標
1.6.2 独自手法を採用した電力需要予測モデル作成事例
FE の事例では、ネットから取得した一部のデータに簡単な編集処理を施したExcelデータを入力した汎用的な処理であるのに対し、下記の2つの事例ではいずれも精密なデータを使い、かつ複雑な計算を行って AI 予測モデルを作成した。本稿で作成した AI 予測モデルとは、予測目的、予測対象期間、予測対象地域が異なるので単純には比較できないが、表 2 に示すように FE の結果の方が高精度である。
事例 1. スパースモデリングおよびアンサンブル学習をベースにした手法 (*1)
高解像度化した多地点のメッシュ気象予測データと各種の実績値を入力し、スパースモデリングおよびアンサンブル学習を併用して、AI 予測モデルを作成した。多地点の予測を1時間単位で行っているが、各手法に依る年間予測誤差は、MAPE で 2.09~2.97% である。
事例2. 重回帰分析をベースにした手法 (*5)
電力需要の傾向が異なる時間帯 (一日を 30 分ごとに分割)、気温(16℃以上か否か)、休日か否かに分割して、重回帰分析で 192 通りの AI 予測モデルを作成した。また、異常値による AI 予測モデル精度の低下を防ぐため、k-nearest neighbor(k-NN) 法で異常値を検知、削除した。年間を通じての MAPE は、2.47% である。
2. まとめ
2.1 電力需要予測結果と中堅中小企業における活用
本稿では、AI 予測キット製品の一つである“Forecasting Experience”:FE と、AI 予測モデル作成のためによく使われる Excel の重回帰分析で、操作性と作成された AI 予測モデルの精度を評価した。精度の評価指標は、電力需要の予測モデルでよく使われる RMSE、MAPE の他に日々の電力需要予測の誤差率とし、誤差率のトレンドグラフ、平均値、標準偏差を含め比較した。
その結果、トレンドグラフには顕著な差異があり、FE による AI 予測モデルの方がいずれの評価指標でも高精度で、かつ操作性がよいことが判明した。実業務で適用するか否かは、業務担当者が判断することになるが、FE による分析の方が従来の Excel の重回帰分析による手法よりも数学的には高精度であり、かつ容易に結果を得ることができた。また、1.6.2 で高精度なデータを入力し、複雑な手法を採用した事例の結果の MAPE が2%台であることを考慮すれば、FE の結果は実用的なレベルといえよう。
AI といえば、難解そうにみえるディープラーニングのような手法を想起しがちであるが、このようにAI に関する知識、経験がほとんど無くても、AI 予測モデルを得ることができる分析手法が存在する。すなわち、AI はむずかしくない。このような分析手法を利用することは、AI 活用があまり進んでいない中堅中小企業においてこそ、大きい効果が期待できる。
2.2 予測業務の民主化
大企業は、以前から多大な経営資源を投入して、業務予測システムを開発、維持管理してきた。最近では、これにさらに AI を導入することにより、精度、効率を改善し、スケールメリットをより活かしている。しかし、中堅中小企業では経営資源の点からも一般にこれを実現できないので、AI を活用した予測業務は、事実上大企業に限られていた。
本稿で示したように、最近では低価格で、多種大量のデータを AI の深い知識なしでも容易に扱える製品が提供されるようになってきた。これらの製品には、ハードウェア/ソフトウェア環境の他に、必要な AI 予測モデル導入や運用支援コンサルティング、データサイエンス等の教育までがセットとして含まれている。このようにAIは単なるブームではなく、広く活用できる状況になった。すなわち、AIの活用により予測業務が民主化されたと言える。
2.3 中堅中小企業における AI 活用の留意点
企業規模の大小にかかわらず、業務の予測を高精度に行うことは重要であり、大企業では従来から多くの経営資源を投入しており、さらに AI 予測モデルの活用で予測精度を上げている。マスコミ等で華々しく取り上げられている事例の多くは大企業でのものであり、予測モデルの高精度化のために、高価な環境やツールを揃えたり、多種大量のデータの収集、分析、モデルのチューニングを行っているものが多い。
一方、中堅中小企業では勘ピュータによる予測がほとんどであったが、AI 予測キットを用いることにより、データを基にした予測業務が可能となった。中堅中小企業でも AI 予測モデルの高精度化は必要であるが、もっと大事なことは AI 予測モデルをいかに活用するかであり、求められる以上の高精度化に固執することは、コストパフォーマンスの観点からも好ましくない。それよりも、特に重要なことは、状況やニーズの変化に素早く対応して容易に使用できる AI 予測キットを駆使して新たな AI 予測モデルを作成し、業務に適用することである。
2.4 おわりに
(Ⅰ) の 2.1 で示したように、日本では高成長が期待できる攻めの ICT 投資が少ない。本稿で示した AI 予測キットによる AI 予測モデルの作成による予測業務は、特に中堅中小企業だけでなく大企業の部門ごとにとっても重要であると考えており、今後、多くの業種、業務へ広めたい。
参考文献
(*1)「気象予測データと機械学習を用いた高精度な電力需要予測手法」 東芝レビュー Vol.74 No.5
(*2) https://www.tepco.co.jp/forecast/html/download-j.html
(*3) https://www.data.jma.go.jp/gmd/risk/obsdl/index.php
(*4) https://www.tepco.co.jp/press/news/2017/pdf/170620a.pdf (2021.9.8)(*5) 人口知能学会 第 34 回全国大会 “電力需要予測業務における機械学習の応用”
Excel は、米国 Microsoft Corporation 社の登録商標です。