クラウドサービス事業
データ利活用という言葉を目にしない日はないくらいになりましたが、利活用する為のデータプレパレーション(前裁きの加工処理)には多大なコストが掛かります。一般的にはデータ利活用の7~8割は、プレパレーションのコストだと言われています。しかしながら、このプレパレーションはニーズが高いものの軽快・簡便・廉価な解決方法が少ない状況である為、データ利活用は資金力や人的リソースに余裕がある法人に限られています。
弊社は、この状況を打開する為に、大手法人や官公庁等で実績のある仕組みをダウンサイジングした上で、体力の乏しい法人でもお使い頂けるようにクラウドサービスで提供しています。
特徴
データの事前準備作業の大幅削減
データ処理前の規格統合作業等が不要もしくは大幅に削減できる為、初見のデータでもすぐに処理が開始できます。
超高速動作と超大量データ取扱
SIGMAの特徴により超高速に動作します。特にバッチ処理はデータを読み込んだ時点で処理が終わるので、これより速いものは存在しません。
理論上、取扱データ量上限や、処理漏れ・取りこぼしは、一切ありません。
シンプルな機能とリーズナブルな価格
大手ベンダの製品のように多くの機能はありませんが、シンプルで使い易い機能に絞っており、その分、リーズナブルな価格にて提供します。
サービスメニュー
1-Read Xtreme Batch
■特徴
CSV形式のデータを読み込んだ瞬間に処理を完了することが出来る、究極のバッチ処理サービスです。
■提供機能
データ加工機能:抽出・連結・集計・ソートの4大機能を有します。通常の技術だと困難な日本語項目をキーにした異種データの連結も可能です。
一括フロー実行:これらの機能は自由に組み合わせ、纏めて実行出来ます。複雑なジョブステップのバッチ処理も簡略化することが可能です。
Webブラウザによる操作:加工条件の編集から処理結果の参照まで、全てWebブラウザ上で簡単に操作することが出来ます。
■利用シーン
業務報告・分析用統計資料の作成:トランザクションやログなどの生データを超高速且つ自由に集計・加工して、レポート作成などに利活用出来ます。
バッチ処理の性能改善:RDBでは数時間を要していた大量データ処理も、数分から数十分で完了しますので、既存システムの外付けで性能改善が図れます。
その他:旧システムからのデータ移行などでもお使い頂けます。
1-Read Data Prep
■特徴
データ利活用に於いて、最もコストが掛かるデータの事前準備作業を、簡単且つ低コストで実行出来るサービスです。
■提供機能
データ整形機能:対話型インターフェイスとプリフィックスメニューにより、プログラミングや統計解析などの専門スキルを持たない人や、本格的なETLを導入する予算がない企業でも、抽出・結合・異常値除去・欠損値補完といった基本的なデータ事前準備作業を簡単に実施することが出来ます。
■利用シーン
BIやAIへのデータ投入:元データが利活用ツールの読み込める形になっていなかったり、IoTやセンサーデータに異常値が含まれていて上手く分析が出来ない場合に、データを適切且つ綺麗な形式・様式に整形することが可能です。
データ分析サービスとのゲートウェイ:Webアクセスログなどを外部のデータ分析サービスに投入したい場合に、サービスプロバイダー側が要求する形式に整形することが出来ます。またサービスプロバイダー側で利用することにより、データ整形起因で諦めていた潜在顧客を誘導することが可能となります。
1-Read Data Lake
■特徴
格納された複数のXMLファイルを、あたかもリレーションが張られたDBのように横串で検索し、検索結果として得られた項目をキーとして渡り歩くことが出来るサービスです。
■提供機能
データ検索機能:複数のXML形式のデータに対し、任意の値や文字列で検索を行うことが出来ます。登録や更新したばかりのデータやそれぞれが全く関係のない異種データでも取り扱うことが出来るので、ほぼ設計レスで簡易型データレイクを構築することが出来ます。
■利用シーン
監査・検査対応:複数の業務システムのデータを特定条件で検索し、更にその検索結果をインプットとして全データを横串で検索することで、一切の漏れもなく、違反行為などを発見することが可能です。
異業種コラボレーション:複数社が参加してデータを持ち寄り、更にオープンデータなども含めて利活用をしたい場合に、データジャケットのやり取り以降の実データの格納と検索、加工(注:1-Read Xtreme Batchを併用)を行えます。
ユースケース
SaaSベンダ様 ならびに そのユーザ企業様
■課題
自社のサービス基盤はオンラインに適したRDBベースのシステムだが、特殊な個人毎のレポートを大量にバッチ生成するユーザ企業があり、サービス基盤上で夜間バッチを動作させている。この夜間バッチの負荷が高い為、処理が朝まで突き抜けており、業務開始時にレポート提供が間に合わず、ユーザ企業からクレームを受けている。
■解決策
弊社サービス上でWebブラウザを用いて簡単にバッチ処理を再構築する。処理対象データを弊社サービスに登録して処理し、その結果データのみを自社サービスに戻してレポートを生成する。
■効果
CRM SaaSベンダ様:夜間バッチ処理の朝までの突き抜けを回避し、ユーザ企業からのクレームが解消出来る。また、サービス基盤のコンピューティングリソースの負荷の軽減を実現する。
ユーザ企業様:レポート配信の迅速化、個別バッチ開発の削減等が期待出来る。
新システムの導入に伴い、旧システムからのデータ移行が必要なお客様
■課題
旧システムの移行元データが相当に汚れている。また、新システムでもバリデーションが変更・追加されていたり、項目の長さが変わったり等々、旧システムとは大きくデータ項目が変わっている。これらの理由で、目検や簡易なプログラムレベルではクレンジングがやり難く、多大な工数を要する。また、移行データ量が多く、翌営業日の業務開始に間に合わない。
■解決策
移行元データを弊社サービス上に登録すると、抽出・連結・集計・ソートの4機能をWebブラウザで自由に組み合わせて処理フローとして実行することが出来るようになる。これにより、移行元データの異常値検出→名寄せ・連続置換や、新システム側の要件に合わせたデータ加工等を行う。
■効果
プログラムレスで移行元データの網羅的なクレンジングが可能となり、データ移行に係る工数の大幅削減が可能となる。また、移行データ生成フローにより、超高速で移行データを作成することが出来るようになり、翌営業日の業務開始に余裕を持つことが可能となる。
様々な異種データを用いて分析を行いたいお客様
■課題
AIやBI等での分析を行う為、自社システムや他社システム、外部データ等の異種データを、日本語を含む様々な項目で連結してフルリッチのレコードにしたいが、共通キー項目が存在しない為、データ連結に非常に困難である。
■解決策
弊社サービスではデータに含まれている全項目での連結が可能である。弊社サービスに連結したいデータを登録し、Webブラウザ上の操作で、トライ&エラーでデータを連結して、希望のフルリッチレコードを生成する。
■効果
プログラムレスで異種データの自由自在且つ超高速な連結が可能となり、AIやBI等でデータ利活用を行う際のインプットデータが簡単に作れるようになる。
DMP SaaSベンダ様 ならびに そのユーザ企業様
■課題
ユーザ企業のWebアクセスデータは、ユーザ企業側で自社形式に加工してもらわないと、自社サービスにフィードすることが出来ないが、ユーザ企業の担当者はシステム部門ではなく業務部門である為、データ加工の難易度が高く、これがネックになって商談を失注することがある。
■解決策
ユーザ企業のWebシステムと自社サービス間のデータ処理ゲートウェイとして弊社サービスを利用する。Webアクセスデータは一旦弊社サービスにアップロードして自社形式に加工し、結果ファイルを自社サービスに送信してフィードする。
■効果
DMP SaaSベンダ様:商談受注確度を向上させることが出来る。また、既存顧客内の横展開拡大を容易化出来る。
ユーザ企業様:DMP SaaSの利用が出来るようになる。システム部門への依頼や外注でのデータ加工を回避し、自部門内で完結することが出来る。
IoTやセンサーデータをAIやBIで解析し利活用なさりたいお客様
■課題
IoTやセンサーデータには不要なものやノイズ(異常値)等が多く含まれていたり、タグ付けがされていない為に取得条件が判らず、その整理や理解に膨大な工数が掛かっている為、本来工数を掛けるべきデータ解析や利活用にまで手が回らない。また、利活用出来ないにも拘らず、生データが捨てられずに膨大に増殖してストレージ容量を圧迫している。
■解決策
非正規化データを多く含む生データに対して、異常値除去・欠損値補完・文字列置換・タグ付け等を容易に行う。更に、データの把握→加工→結果の可視化→プレパレーションのライブラリ化、というプロセスを繰り返し行うことでニーズに合わせて処理機能を自由に拡張(成長)させ、プレパレーションを継続的に容易化・高度化する。
■効果
生データのプレパレーションが短時間に少ない工数で可能となり、コストを削減出来ると同時に、より戦略的なデータ分析にリソースを振り向けることが出来る。また、利活用可能な生データの割合を増やしたり、逆に利活用不能な生データを早期に判断して削除することにより、ストレージ容量を削減することが出来る。
膨大なデータの中に、任意の値やパターンが存在するかしないかを確実に把握なさりたいお客様
■課題
膨大な部品点数を使用している機械に於いてある品番の部品を探したかったり、公開されている遺伝子データベースには存在しない生物の特定の塩基配列を抽出したかったりするが、インデックス経由の検索だと確実性が落ちる為、存在するかしないかの証明が出来ない。
■解決策
弊社サービスはデータを頭から1文字単位に全てスキャンする方式である為、弊社サービスに対象データを登録するだけで、インデックスを生成することなく、超高速でフルスキャニングを行うことが出来る。
■効果
対象データの中に、目的の値やパターンがあるかないかを確実に把握することが出来る。存在する場合は値やパターンの存在する位置や個数を把握出来る。また、存在しない場合は、存在しない旨を証明することが出来る。この用途の為に、膨大な容量を消費するインデックスを生成する必要もなく、コストが圧縮出来る。
監査・検査・コンプライアンス等が頻繁にある金融機関様等の規制産業で、とにかく全量データを格納しておき、アドホックな条件で抽出なさりたいお客様
■課題
従来は大規模な情報系を整備し、データウェアハウスや複数の目的別データベースを構築しているが、上流にあるチャネルフロントや勘定系/記帳系システムから下りてくる加工済みデータでは項目等が切られたりしている為、想定外の監査や検査で対応出来ないことがある。
■解決策
マスタ・ジャーナル連結を行った上流システムのフルリッチレコードのファイルを、弊社サービスのシステム別ディレクトリに登録しておき、”使えるデータのゴミ箱”として用いる。必要時には全量データの中を自由自在に検索することが出来る。
■効果
当局に対して、全量データが保全されており、且つ、最低限の検索は出来ることを証明出来る。目的レコードを発見した場合には、データソースのアプリケーションで正確な追跡を行うことが出来る。また、大掛かりなデータレイクを構築する必要がない。