ホーム > 産業・しごと > 商工業 > 京都府の産業支援について > 株式会社 Geek Guild(京都企業紹介)

ここから本文です。

株式会社 Geek Guild(京都企業紹介)

知恵の経営元気印経営革新チャレンジ・バイの各認定等を受けた府内中小企業を紹介するページです。

京都府企業紹介(業種別) 京都府企業紹介(五十音順) IoTrobot 京都府の産業支援情報

高精度なAI学習済みモデルを使えるライブラリ「SmallTrain ver. 0.2.0」ソースコード公開

(令和2年11月9日、ものづくり振興課)

サービスイメージ

 株式会社 Geek Guild(外部リンク)(京都市)の尾藤代表取締役副社長 COOにお話をおうかがいしました。

--今回は「SmallTrain ver. 0.2.0」ですか?!

尾藤)はい。多様なデータを学習済みのAIモデルを起点に、転移学習をするだけで工数をかけずにAIを構築できます。SmallTrainを使うと、精度を損なわず、大量のデータを取得する労力もいらず、ディープニューラルネットワークを迅速に開発できます。オープンソースなので、無償で誰でも利用できます。「商用利用に耐えるAIを人々に届けたい」、「利用者と共にブラッシュアップしていきたい」という願いでソースコードを公開しました。

--いいですね。改めまして、利用想定例は?

尾藤)はい、

  • ダイナミックプライシング。ホテルの客室価格予測など時系列データを使ってダイナミックプライシングができます。
  • 処方箋認識。処方箋を画像認識でデジタル化します。文字を認識します。
  • 薬剤画像認識。自然光、薬局の通常のカウンターで薬剤の画像認識ができます。薬剤の種類が多いため、難易度の高い画像認識です。
  • AI-OCR。あらゆるデジタル文字を認識する汎用的な文字認識AIです。様々なフォーマットに対応できます。
  • 画像認識。汎用的な画像認識AIなのであらゆる要望に合致させます。
  • 時系列データ予測。発電予測、消費電力予測、発電所異常検知等の、高精度な時系列データ予測をしています。

などですね。

ダイナミックプライシング 処方箋認識 薬剤画像認識
AI-OCR 画像認識 時系列データ予測

 

--特徴をまとめますと?

尾藤)はい、

  • 主にPythonで記述されており、TensorFlowのラッパーです。将来はKerasやPyTorchのラッパーともなり、TensorFlow、Keras、PyTorchユーザーのかけはしとなることを掲げています。
  • エンジニアやデータサイエンティストに馴染み深いアーキテクチャとして、Pythonモジュールの形式を採用しています。KerasやPyTorchと同じような使い方なので、使い方の学習にかかる時間が短縮され、モデルの構築により多くの時間を費やすことができます。
  • データサイエンスの概念に関する事前の知識がなくても、モジュールを再利用することで、ディープニューラルネットワークを迅速に開発できるように設計されています。
  • オープンソースなので、バグフィックスか改善を開発者1人で抱え込まず、みんなで協力して開発することができます。
  • 簡単なインストール。数回クリックするだけで開発できるように、AI学習済みモデルをセットアップできます。
  • 高精度モデル。当社のハイスペックなデータサイエンス手法・GPUマシンを使用してすでにトレーニングした学習済みモデルを公開しています。高精度モデルを起点として、様々な課題解決に最適なソリューションを提案することができます。
  • SmallTrainの使い方・利用シーン。入門として画像認識のモデルの作り方を紹介していますが、時系列データ予測、音声認識など、幅広いAIサービスに使うことができるライブラリ、TensorFlowのラッパーとして使えます

 

皆様、ぜひ!!

 

世界を制するオープンソースAIライブラリ「SmallTrain」

(掲載:令和2年4月15日、聞き取り:令和2年2月、ものづくり振興課 足利)

製品イメージ

 株式会社 Geek Guild(外部リンク)(京都市)の尾藤代表取締役副社長 COOにお話をおうかがいしました。

オープンソースAIライブラリ「SmallTrain」

--別のAI企業を経営されてらっしゃった頃からのお付き合いですが、改めて御社の概要を教えてください。

尾藤)「汎用人工知能」の開発をめざす組織として2018年に設立しました。社名は、米国の優秀なAIエンジニアが自らをGeek(ギーク)と呼称していることから、最先端のAI技術を提供できる高度なAI研究開発ギルド(組織)という意味です。

成長戦略

--「汎用人工知能」というのは?

尾藤)特化型の人工知能ではなく、それらを作るAIベンダー、エンジニア向けの機械学習フレームワークとでも言いましょうか。「FORECASS」として親しんでいただいてましたが、「SmallTrain」と名称変更、リニューアルし、オープンソースで提供します。具体的に言いますと、Pythonで書かれたオープンソースのニューラルネットワークライブラリです。TensorFlowまたはPyTorchの上で実行できます。ディープニューラルネットワークでの高速実行を可能にするように設計されており、プロのエンジニア向けのツールとして、ユーザーフレンドリーでモジュール式、拡張可能であることに焦点を当てています。

製品画面
図「SmallTrainの機能と構造」

--SmallTrainという名称の意味は何ですか?

尾藤)ビッグデータではなく、スモールデータでいい、という意味での「Small」と、「Train」は訓練、学習ということですね。学習済みモデルとしては、グローバル企業が既に出していますが、それを凌駕する性能と、それでいて使いやすいものになっています。

AI構築が早くてラク、データは手持ちのものでいい、ハードウェアも特別なもの不要

--スモールデータでいい?学習済みモデル?

尾藤)通常、AIの構築には、学習データを入力しパラメータをチューニングする際の専門的な知識、手間とコストが必要で、AIベンダーの仕事の負荷はそこにあります。

--私の安易な理解では、機械学習では、人が定義したデータの特徴から関数(法則)を生成する「法則の自動化」が行われ、ディープラーニングでは、データの特徴の定義をも自動化する、「特徴法則化の自動化」が行われていると思うのですが、とはいえ、機械様にデータの特徴を見出してもらえるように、人間が多層構造のニューラルネットワークを組んで、微分や線形代数など高度な数学知識を駆使して、かなりのお膳立てをしているように思います。

尾藤)そのとおりですね。加えて、AIにデータを入力して学習させるためにはGPUを使った高速処理が必要です。

--なるほど、そうですね。

尾藤)しかし、SmallTrainでは、ユーザー様がお持ちのデータを学習させ、その分野のAIプログラムとして構築していっていただくものではありますが、ベースの部分は、既に学習し終えていて、例えば60ピラミッド階層ものニューラルネットワーク構造を構築済みです。

--そうなのですね。

尾藤)従いまして、まず、AIにデータを学習させる⼿間とコストを大幅に削減でき、あとは簡単な作業のみで、しかも画面で簡単に操作できるものです。また、ビッグデータは必要なく、データ収集のための膨大な時間とコストを省けます。さらには、短期間に開発ができるので開発コストがぐんと下がりますし、計算処理を⾼速化できるアルゴリズムを搭載しており、特別なハードウェアも不要です。

製品の特長

異常検知、薬剤検知、エネルギー需給予測、ダイナミックプライシング、ロジステック自動発注

--どういったAI構築に利用されているのでしょうか?

尾藤)当社自身がSmallTrainを用いて開発したものとしては、例えば、生産工程の異常検知ですね。お手持ちのデータを最大限に生かし少ないデータで検知できる技術があるため、センサーで追加のデータ収集をお願いすることが原則ありません。大手企業の工場ラインの設備で少ないデータからの異常検知のPoCを実施されています。

生産工場風景

--なるほど。

尾藤)あるいは、調剤薬局の薬剤監査システムAIなどございますよ。薬局で薬を調合される際に、薬剤師の調合が処方箋通りかどうかを画像認識で監査するシステムなのですが、既存のシステムでは大きな機材が必要なため、SmallTrainで、低コストで監査精度99%以上、1秒1監査という高精度・高性能を実現しました。粉薬の小さな粒でも正確に判別できるのです。

--すごいですね。

尾藤)さらには、エネルギー関連ですね。発電量と消費量を予測し、効率の良いエネルギー循環をつくります。SmallTrainで需要と供給の値を予測すると、発電事業の売電計画が立案しやすくなります。また、発電量の予測値と実測値の乖離により、発電所の不具合の発見にもつながり、発電所のO&M事業にも役立っています。SmallTrainの発電予測は平均二乗誤差率が1%未満という世界トップ水準の精度なので、実践の発電事業のエネルギーマネージメントEMSに利用できるのです。これまで、新電力事業における売電収入アップ等にも貢献してまいりました。

ソーラー

--いいですね。

尾藤)あるいは、販売価格の最適化やダイナミックプライシングです。時間ごとに変動のある価格の予測はたいへんな作業です。しかも、他社との競争のなか最適値を割り出すのは人間には至難の技です。SmallTrainは、需要と供給のバランスを考慮し、競合他社の価格と比較し、その上で、売上を最大化にするために最適な価格を予測します。例えば「ホテルの客室」の価格決定にSmallTrainを利用しました。ホテル予約は1ヶ月前からが重要です。客室の予約状況は、ホテル客室予約サイトの価格に、大きく影響されます。良い値付けをすることでホテルは営業利益を最大化できます。様々な予約サイトから上がってくるデータを元に、安すぎず利益が大きくなる値付けを提供します。ホテル市場には予約・販売サイトがたくさんあり、各サイトごとにセール価格を設定するため、実際にお客様が支払った価格が、ホテルの卸価格とそれぞれ異なります。実質、ホテル側には“日毎の客室価格の卸価格”と予約サイトから送られてきた“お客様が支払った(家族分の)合計価格”しかない場合がありました。それでも、追加にデータ収集を依頼せず、“今ある価格データ”で予測を提供いたしました。

活用事例

--素晴らしいですね。学習方法は、教師あり学習?

尾藤)異常検知、薬剤検知等は「教師あり学習」ですが、「強化学習」によるものもありますよ。例えば、ロジステック自動発注というものでして、ある企業の倉庫から各店舗への配送の回数を極力減らすことを目指すことを目的に、倉庫への発注のタイミング、商品ごとに箱の大きさが違うわけですが、そうした容積などを勘案し、トラックにどう効率的にタイミングを合わせて発注するか、といった、もはや人の頭ではどう計算していいのかわからないようなことに「答」を示してくれます。

--おもしろいですね!しかし、他のAIベンダーに対しても、オープンソースなのですよね。AIベンダーが喜ぶ技術的な点は他にもありますか?

尾藤)はい。昨今では学習済みモデルが色々と公開されています。ただ、それらはほとんどが研究やPoCに適しているが、実運用には使いにくいということがあります。SmallTrainは商用での実運用に利用してきた学習済みモデルを公開しますので、商用のためのAIモデル構築を考えるプロ向けになります。だからビッグデータがなくともできる、マシンパワーを使わずにできるということにこだわり、実運用の際のコスト削減に注力しています。

--そのほか、具体的な事柄を少し説明してください。

尾藤)はい。少し技術的な話で恐縮ですが、SmallTrainはGoogleのTensorFlowだけでなく、FacebookのPyTorchにも対応していきます。どちらのライブラリから関数を呼び出すことができます。これがラッパーといって、すでにあるライブラリから関数を呼びだし、高い数学的知見を用いなくてもAIモデルをつくることができるSmallTrainの1つ目の特徴です。(図「SmallTrainの機能と構造」の1の部分)

--なるほど、GoogleやFacebookの両方のライブラリがつかえるのですね。

尾藤)ライブラリに関しては、SmallTrain自体も関数(数学的な)ライブラリをもっています。最新論文が発表されるたびに自社内で検証をし、有効なアルゴリズムは取り入れるようにしています。この作業は数学的な知識と、英語論文の読解力、それに書かれているアルゴリズムを実装するプログラミング能力が必要ですので、大変な作業と言えます。これをいち早く行い、ライブラリにしていきます。SmallTrainを使うと最先端のアルゴリズムを利用できるようになります。(図「SmallTrainの機能と構造」の3の部分)

--英語の論文を読んで、プログラミングするのは大変そうなので、SmallTrainがやってくれるなら、それはいいですね。

尾藤)ええ。それに、自社内で開発したアルゴリズムやノウハウをたくさん盛り込んでいますので、それもオープンにしています。
まだ準備中で完全なオープンソースではないのですが、少しずつオープンソース化を進めていきます。

 

 

今後、ますます楽しみですね!

お問い合わせ

商工労働観光部ものづくり振興課

京都市上京区下立売通新町西入薮ノ内町

ファックス:075-414-4842

monozukuri@pref.kyoto.lg.jp

より良いウェブサイトにするためにみなさまのご意見をお聞かせください

このページの情報は役に立ちましたか?

このページの情報は見つけやすかったですか?