2017-08-16

OneTab のTabリストを整理するCLI をgolang で作ってみた #golang #onetab

メモ golang

便利な

みんな知ってるGoogle Chrome 拡張機能のOneTab

chrome.google.com

ちょー便利なのでよく使うんですが、気軽に使えすぎてOneTabのリストがどんどん膨れ上がってきませんか？

・・・と、こんな感じでどんどん増えて行くわけですが

OneTab に同じURLが登録されている
OneTab 側にリストを整理するような個別な機能がない
- UI上でマウスを使って移動や削除はできる
- 数が多くなるとこの操作も大変
リストの登録件数が多くなると重くなる
- PCのスペックにもよるが手元だと2,000件ぐらいから重い
- 登録や削除が重くなる

というわけで、他に需要があるとは思えないCLIを作ってみました。自分でも使ったのも1回きりというね・・・

作ったのは

github.com

使い方は簡単でOneTabからURLの書き出しで出力されるリストをファイルに保存して

コマンドラインで保存したファイルを指定してコマンドを実行するだけ

$ ./tlc run "your_file_path" -w

-wオプションでHTTPリクエストでURLがアクセス可能かどうかをチェックします。

やってること

すごい単純なことしかやってませんが

OneTabから書き出したURLリストを保存したファイルを読み込む
読み込んだファイルからURLをキーにしてURL文字列が完全一致するものを削除
URLで削除したリストを今度は名称文字列が完全一致するものを削除
-wオプションが指定されていた場合、URLがアクセス可能か（status == 200)かどうかチェックする

だけなので、当然ですが

URL文字列が異なり同じWebページだった場合は違うとみなされる
- 例えばSNSからのリンクがわかるようなパラメータ付きとパラメータ無しのページなど
名称文字列が同一でURLが異なる場合は、同一とみなさせる
- すべてのページで同じ名称がつけられているページなど
URLのアクセスチェックでステータス200以外の場合はアクセスできないとみなされる
- ブラウザと同等の判定はしていないため、ブラウザで見れるのNGと判定される場合がある

という制限？問題点？はあります。

ダメだったこと

簡単にできそうで、できなかったことを書いておこうかと。

URLからHTMLの内容を取得して、取得した内容をハッシュ値で比較
- セッションIDや広告IDなどのアクセスするたびに異なる値がHTMLに含まれることがある
- これによりハッシュ値が同一のページでも毎回異なる
URLにアクセスできるかをブラウザと同等の判断で行う
- ブラザと同等となるとブラザそのものでチェックした方が早い
- 現状ではCDNでJSを使ったリダイレクトなどしていると上手く判定できない
- リダイレクト回数が多い場合に上手く判定できない

そもそもよく考えたら、どれもダメだよねーとw

まとめ

とりあえず動くところまでは出来ている
golangって便利ですなぁ
リストの重複を除く仕組みをもうちょっと考える必要がある
今ならGoogle Chromeのヘッドレスモードを利用できるならした方が良さそう

github.com

CLIにしたけどWebでできた方が手軽そう
というかOneTab側になんか整理する機能があってもいい気がする
そもそもこんな使い方している人が他にいないかもしれないw

以上になります。

2017-08-14

GitHub のREADME にgif 画像を表示する1番簡単な方法 #github #gif

GitHub メモ

画像を

GitHubのREADMEにgif画像を貼り付けたいってことってありますよね。今回作ってみたこれ↓でも1枚だけ貼り付けたい感じになりました。

uchimanajet7.hatenablog.com

当然Google先生でgithub readme gifとか入力して調べてみるわけですが

github readme gif
https://www.google.co.jp/search?q=github+readme+gif

どーやら↓の2つの方法が主流っぽい感じ？

リポジトリにmaster branch以外の画像のbranchを切りそこに画像をアップロード
GitHub Wikiのリポジトリに画像用フォルダを作りそこに画像をアップロード

1の方法は確かに手軽だけど、それだけのためにbranchが残り続けるのが個人的には好きじゃないので却下。これするなら素直にmaster branchに画像ファイル追加するなぁ

2の方法は利用したこともあるし、Wiki使ってドキュメント書くならアリだと思うんですが・・・今回はファイル１個なのが迷うところ。

2と似てるけどGitHub Pagesでも同じようなことは出来ますよね。こっちもページ公開するならアリだと思うけど、今回はファイル１個・・・

もっと手軽に

画像１個で画像自体のバージョン管理が必要ないので、もっと簡単に出来ないかなぁーと。そこで思いついたのが以下の方法になります。

GitHubのリポジトリにissueを起こして、そのissueに画像を貼り付ける
issueの画像はMarkdown記法でリンクが記述されているのでそれをコピー
画像を貼りたいREADMEにこのリンクを張り付ければOK

今回はこの方法を利用しているので、実際にissueに貼った画像を使ってREADMEに画像を貼り付けています

github.com

この方法の良いところ

issueを作って画像を貼り付けるだけなので手軽
余計なbranchが残り続けることもない
issueなので、そのissueのためにbranch切ってpull request起こせば、なんでこうなってるのかがあとからもわかる
そもそもREADMEを更新するのでpull requestを起こすはず
issueなので対応が終わったらcloseしちゃえば良い
画像を差し替えたい場合も、差し変えるためのissueを起こせば同様の手順でOK
issueの画像リンクがMarkdown記法なので、そのままコピペできる
何と言っても手軽

ということで、手軽で良い感じかと。何かの参考になれば。

以上になります。

2017-08-12

日経Linux2017年9月号にちょっとだけ載った件 #ITpro #swx #aws

swx メモ AWS

きっかけは

先日↓退職Blogをアップしていたおねーさんが

gyori.hatenablog.com

社内Slackで
「Amazon AIネタで雑誌に書いてみませんかー？締め切り近いけどw」
的な募集をかけていました。なんてゆるいw 素敵すぎる！

Amazon Pollyなら以前にアドベントカレンダーでネタにしたこともあるのでワンチャン！と思いとりあえず手を挙げてみました。

uchimanajet7.hatenablog.com

そしたらありがたいことに執筆させてもらえることになりました。

書いたのは

記事を書いたのは↓の「日経Linux2017年9月号」で、内容はAWSのAIサービスについてになります。

itpro.nikkeibp.co.jp

実際にはAmazon PollyとAWSの概要についてを担当しました。

aws.amazon.com

書いてみて

書くのにあたってAWSサイトを色々見たけど、ドキュメントが多くてしっかり書いてあるのを再認識
というか、これWebが見らえる環境ならわざわざ紙にする必要があるのかどうか気にするレベル
規定の文字数にまとめるのは大変
雑誌という限定される中で、編集の方がいろいろ工夫されているのがわかった
どの業界でもユーザーにどうやって価値を届けるのか？に違いはないんだなぁーと
こちらが雑誌という媒体に慣れてないため、何度か手間を取らせてしまった
次回からもうちょっと色々考えてこちらから提案できるようにしたい
知ってるつもりでも、まとめたり再度調べなおしたりすると色々と発見もあり自分でも大変勉強になった
とにかく良い機会だった

まとめ

気になったら是非お手にとっていただければ！
日経Linuxに小さいけど自分の名前が載るとかテンション上がる！
おねーさんと最後にお仕事っぽいことが出来てよかった！
雑誌編集の人の雑誌に対する姿勢にいろいろ学べた
雑誌だろうと、Webサービスだろうとやっぱりユーザー視点ってすげー大事だなと
もっと他の業種の人とも一緒に仕事できると、こういう気づきがありそうなので機会があれば積極的にやっていきたい
文章書くのに慣れてないから時間がかかった
けど楽しいので文章書くのも機会があれば積極的にやっていきたい
こういう良い機会に関われてよかった

↑少しですがちゃんとCloud Automatorの宣伝もしておりますw

uchimanajet7.hatenablog.com

cloudautomator.com

以上になります。

2017-08-09

Cloud Automator のAPI を呼び出すCLI をgolang で作ってみた #cloudautomator #golang #swx

swx メモ golang cloudautomator

知ってますか？

Cloud Automatorというサービスがあるんですが・・・知ってますか？

cloudautomator.com

簡単に言うと 画面からのカンタン操作でAWSの運用を自動化 することが出来るサービスかなーと。画面から操作できるのは大変便利なのですが、大量の定型処理を行う場合にはやっぱりしんどいですよね・・・

しかし、最近Cloud AutomatorのAPIが公開されました。

blog.serverworks.co.jp

Cloud Automator API
https://cloudautomator.com/api_docs/v1/api.html

APIはあるけど・・・

APIが公開されていれば、プログラムの中から使えるから画面からの操作じゃなくてもなんとかなる！と、現実はそんなに簡単ではないのでなかなか難しいところもありますよね。

じゃーターミナルでcurlを使って頑張ればいいじゃないか！と、思うじゃないですかー

qiita.com

・・・黒い画面大好きな国の人でもちょっと大変という感想がっ！ SDKとかCLI何かがあれば多少は違うのかなぁーと思いつつ、Cloud Automatorのサービススタンスとしては、CLIは難しいラインなのかなぁーとも思いつつ

そこで

仕事で考えるからややこしい話になるんだなぁーと気がついた＆最近議事録や予定調整などしていて、コードも書いてなければAWSも触れてないと気がついたので、せっかくだから公開されているAPIドキュメントを見ながらCLIを作ってみることにしました。

CLIを作るにあたって、身近なCLIを参考にするのが良さそうなので以下の2つを色々見てみました。

aws.amazon.com

github.com

自分が使うだけなので、手元のMacとAmazon Linuxで動けばいいのでPythonって選択肢もアリでしたが、やっぱりここは仕事では書く機会がありそうもない大好きな言語であるgolangで作ってみようかと。

golangにはcobraというちょー便利なパッケージがあるので、もちろんこれを利用して作っています。

github.com

他にも色々と便利なパッケージがあり、今回は

github.com

なんかを利用しています。

awesome-go.com

go.libhunt.com

また、上記のようにgolangのパッケージをまとめているサイトがいくつかあるので、こういうサイトを利用して必要なパッケージを検索出来るのはありがたいです。

とりあえず

自分用ということで作っていて、とりあえず動くところまではできた感じです↓

github.com

golangのクロスコンパイルでMac/Linux/Windows用のバイナリファイルは作りましたが・・・MacとLinuxは動くのは確認しています。Windowsは動かなかったらゴメンなさいw

github.com

インストールとか操作については、README.md＆ヘルプコマンドの表示で何とかしていただければ・・・

github.com

分かりにくいところ

Create Job のAPIで受け取るパラメータのrule_valueとaction_valueが直感的ではないので、少々分かりにくいかもしれません。

Cloud Automator API
https://cloudautomator.com/api_docs/v1/api.html#ジョブ-post

上記のAPIドキュメントを確認すると、rule_valueとaction_valueについてはobject型の値を渡さないといけないようです。

object型はJSONになるのですが、CLIでJSONは結構大変なので今回は以下の例のように対応しています。

$ ./ca job create \
--name "ca job create exsample" \
--aws-account-id 1 \
--rule-type cron \
--rule-value hour=2,minutes=0,schedule_type=weekly,weekly_schedule=monday,friday \
--action-type create_image \
--action-value region=ap-northeast-1\
,specify_image_instance=identifier\
,instance_id=i-xxxxxxxxxxxxxxxxx\
,generation=1\
,image_name=exsample-ami\
,description="Job Create Exsample Cloud Automator CLI"\
,reboot_instance=true\
,additional_tag_key=name\
,additional_tag_value=exsample\
,add_same_tag_to_snapshot=true\
,trace_status=true\
,recreate_image_if_ami_status_failed=true

–rule-value hour=2,minutes=0,schedule_type=weekly,weekly_schedule=monday,friday

“APIのパラメータ名=値” の形で指定して、パラメータ同士は",“で繋いで表現してください。また、配列を表現する場合は”APIのパラメータ名=値,値,値“のように値を”,“で繋いで表現してください。

作ってみて

golang はやっぱり楽しいねーもっと使えるようになりたい
各種パッケージで色々できるのは楽でいい
SORACOMさんのCLIはAPI定義からSDKなんかと一緒に自動生成みたい
手で組んでも作れるけど、同じようなコードになっていくから自動生成は幸せになれそうで素敵
Cloud AutomatorのAPIも確か API Blueprintを使っていたはずなのでワンチャンあるかも？

API Blueprint | API Blueprint
https://apiblueprint.org/

object型をCLIで表現するのに困った
AWS CLIの引数指定の仕方を参考にしてみたが、APIパラメータを知らないと使えない感じもするので悩ましい
自分用に作ったのでテストがなかったり、コメントだらけのソースだったりすのでなんとかしたい
Circleci2.0を使ってみれたのはよかった。速くてすばらしい
Codeshipも気になるので時間があるときに使ってみたい
golangで作られたツールのリポジトリを見ると、AppVeyorを利用してWindows環境でテストとビルドをしているところも多いみたいなので気になる

circleci.com

codeship.com

www.appveyor.com

使ってみたかったslideshipをやっと使えた

slideship.com

Markdownでサクサク書けるのは便利
簡単に作れるので使っていきたい

slideship.com

APIドキュメントが間違っている可能性？

Cloud Automator API
https://cloudautomator.com/api_docs/v1/api.html#ジョブ-patch

API定義からAPIとドキュメントが生成されていない？
ドキュメントだけ間違っている場合は、このドキュメントを元に作っているので間違った仕様になってしまう
上記の場合だとedit処理なのに、id意外も必須とされている・・・

まとめ

楽しいのはやっぱり大事だよね
手を動かして作っていかないと知らないことも多くなってる
自分用でもちゃんと最初からテスト書こう
もうちょっと頑張ろうと思った

以上になります

2017-06-29

Microsoft Azureオンライントレーニングをやってみた #microsoft #azure #mooc

azure

AWSは好きで触る機会も多いのですがここのところ他のサービスやプロダクトはなかなか触る機会がありませんでした。

これではイカン！と思い今回は時間を作って Microsoft Azure を触ってみました。

なぜAzureか？

先日のGoogle Cloud Nextに参加して、時間があるときに触るならGCPだなーと思っていたんですが・・・

cloudnext.withgoogle.com

みんな大好きガートナーのマジッククアドラント2017年版のIaaSでAWSに続き2位がAzureだと。

www.publickey1.jp

加えて、AWS技術者のためと記載があるオンライントレーニングがあるとのことだったので触ってみる事にしました。

オンライントレーニング

Microsoft Azure を触ってみるとは言っても、何か急いでやることがあるわけではないので今回はマイクロソフト社が用意している無料のオンライントレーニングを利用してみました。

Azure Training Courses | Microsoft Learning
https://www.microsoft.com/ja-jp/learning/azure-skills-training.aspx

たくさんあるオンライントレーニングの中から、 AWS の専門家のための Microsoft Azure というわかりやすい名前のものにチャレンジしてみました。AWSはSAアソシエイトしか持ってないので全然専門家ではないのですが・・・

AWS の専門家のための Microsoft Azure | Microsoft Learning
https://openedx.microsoft.com/courses/course-v1:Microsoft+AZURE213x_JPN+2017_T2/about

当然この他にも無料で受講できる多数のオンライントレーニングがあり、今回利用したオンライントレーニングと同様に日本語化されているものも多いので、ご興味ある方は一度見てみることをおすすめします！

次はオンライントレーニングを受講するために必要なアカウントを取得していきたいと思います。

microsoft learning accountの取得

AWS の専門家のための Microsoft Azure | Microsoft Learning
https://openedx.microsoft.com/courses/course-v1:Microsoft+AZURE213x_JPN+2017_T2/about

上記オンライントレーニングサイトで利用するアカウントになります。登録はもちろん無料で入力項目も多くないのですぐに登録できると思います。

登録が完了したら今回受講するコースのAWS の専門家のための Microsoft Azureを選択して受講ができるようにします。

このトレーニングサイトはOSSで提供されているOpen edXというプラットフォームを利用してAzure上で動かしているようですねー

github.com

無料のAzureアカウントの取得

azure.microsoft.com

上記のサイトから登録すると

¥20,500の無料クレジット付与
30日間の完全無料期間
無料期間中の支払いはなし

の状態でAzureを使い始めることができるようです。クレジットの付与とか期間限定での全サービス無料はすごく良いですねー

azure.microsoft.com

30日間の期間が終了しても無料枠が設定されているサービスは複数あるので、継続利用ができるのは助かりますね。

登録するにはクレジットカードが必要になります。これはサイト上にも記載がありますが課金のためではなく、ID認証に使用されるようです。

また、登録確認のコードがSMSで送られてくるためSMSを利用できる電話番号が必要となります。

もしMicrosoftアカウントを持っていない場合には、まずMicrosoftアカウントの取得が必要となります。

ホーム - Microsoft アカウント
 https://www.microsoft.com/ja-jp/msaccount/default.aspx

登録が終了してAzureポータルにログインすると、クレジットが付与されていることを確認することができます。

以上でアカウント関係の準備が終わったので、次はいよいよ本題であるオンライントレーニングを進めていきたいと思います。

オンライントレーニング実践編

オンライントレーニングサイトにログインして、今回受講するAWS の専門家のための Microsoft Azureを選択します。

あとはCourseタブを選択して、ドキュメントを順番に読み進めていくことでトレーニングを進めることができます。ドキュメントはモジュールと言われる単位で章に分けられていて、各モジュールごとに1つのテーマを学習できるようになっています。

取得したAzureアカウントを利用するような部分はラボと呼ばれていて、基本的にはドキュメントに沿って自習していく形になります。

また、説明の動画が用意されていることがあり、動画自体は英語ですが動画横に字幕として日本が表示されているので、個人的に英語に弱いのでとても助かりました。

オンライントレーニングの最後には最終評価として、これまでのトレーニングで得た知識をチェックする選択式の質問があります。

すべての質問に回答すると、最後にスコアが表示されます。オンライントレーニングの終わりに任意回答のアンケートがあり、それですべてのオンライントレーニングが終了となります。

オンライントレーニングの詳細な内容については、受講して体験してもらうのが良いと思うので、ぜひチャレンジしてみてください。

まとめ

個人的によかったところと、もうちょっとカイゼンしてもらえたら嬉しいなーと思ったところを記載してみました。

よかったところ

ドキュメントが細かいところまで詳しく書いてある
関連するドキュメントなどにリンクされている
モジュール単位で分割されているので、知りたい情報や学習したい部分がわかりやすい
最後に理解度を試せるのは良い
Azure Active DirectoryやAzure Resource Managerなど、知らないことも多く勉強になった
- Azure Resource Managerが便利で素敵
AWSとAzureの比較があることで理解しやすい部分もあった

もうちょっとカイゼン希望

アカウント取得がちょっと面倒くさい
オンライントレーニングならSandbox的なところで出来ると嬉しい
日本語化がおかしなところがある
Azureのアイコンとサービス名を覚えるまで大変
最終評価で間違った問題だけを見られるとか工夫が欲しい
- もっと言うと間違った問題の正解がわからない
- 間違った問題の正解を表示するか、モジュールのどの部分を学習しなおしするのかリンクなりで案内してほしい
- 復習を行うときに便利だと思う
CLIの実行がWindows OS前提っぽい？のはちょっと残念
- 実際にはAzure上にWindows OSの仮想マシンを用意すればいいので問題はない
Linux仮想マシンへの接続は、Windowsより若干面倒に感じる
- Windowsと同じぐらい簡単に出来ると嬉しい

とにかくドキュメント量が多く質も素晴らしいので、丁寧に読んだりリンクされている先まで読んだりしているとなかなかの時間がかかります。

このコースを最大限に活用するため、各モジュールの学習に平均 3 ～ 4 時間をかけることをお勧めします。

と、最初に書かれていたので平均合計時間は 3 ～ 4 時間×6モジュールで18～24時間かかる想定のようです。

で、実際にはどのぐらい時間がかかったのか？という所ですが・・・今回は細かく計測してないので正確ではないのですが、だいたい20時間前後ではないかと思います。

最初の方は細かくドキュメントを追っていたので思ったより時間がかかった印象で、慣れてきた中盤は引っかかる部分だけ読み込む形になり、Azure Active DirectoryやAzure Resource Managerなどの全然知らなかった項目で、また時間を使った感じになりました。

進め方は人それぞれかと思いますが、AWSの考え方と似ている部分があったり、以下のようにAWSとの比較をしてくれている資料が出てくる部分があったりとしますが、比較で覚えるのではなくAzureが持っている特徴を理解していくのがいいのかなぁーと感じました。

自分のペースで進めていけるので、トータル時間はそこそこ必要ですが無目的にAzureを触るよりは断然お勧めできます。私個人としてはAzure Active DirectoryやAzure Resource Managerのモジュールは大変勉強になりました。

もしAzureアカウントを取得するのが面倒であれば、一旦オンライントレーニングのアカウントだけでも良いので取得して、まとめられた豊富なドキュメントを読んでみるのがいいのではないかと思いますので、ぜひお試しください！

以上になります。

2017-05-26

社内のLT大会で「期待値コントロール」について話してみた #swx #lt

メモ swx LT

今所属しているサーバーワークスでは毎週金曜日にLT大会を開催しています。発信力強化と発表に慣れるために基本的には全員が発表対象になっています。今回はLT Advanced Generation ! と称して3チームに分割されて対抗戦として発表することになっています。

これまでの社内LTに関しては以下を見ていただければ、雰囲気をわかってもらえるかと思います。

blog.serverworks.co.jp

www.youtube.com

決まりごと

テーマは 仕事のはなし
持ち時間は5分
発表後に投票により順位付けされる
全員が最低1度は発表する

チーム対抗戦で発表に投票で順位付けされるのがあるので、好きに発表できるわけじゃないのが難しいところ・・・

過去の発表資料や動画を確認すると自由な人もちらほらいらっしゃいますがw

今回は

今回は技術ネタが間に合わなかったので、個人的にはあまり話す機会のない少しエモい話しをしてみました。

speakerdeck.com

blog.serverworks.co.jp

発表中は

さて、今回の発表中は エモい という言葉を聞いたことがない/使ったことがないという方が数名いて、ちゃんと説明しなかったために伝わらなかった部分があったので、次の機会にはもうちょっと丁寧にいろいろ伝えないとダメだなぁーと

まとめ

慣れないテーマで話すときはいつも以上に資料も話も丁寧に
意識していろいろやることは重要
LTのネタ集めは計画的に

宣伝

LTを含めてサーバーワークスのことが気になったら、お気軽にお問い合わせください。オフィス見学もできますので是非お越しください！

www.serverworks.co.jp

www.wantedly.com

以上になります。

2017-04-07

LambdaのLogをCloudWatch LogsからKinesis Firehoseを利用しAthena＋QuickSightで可視化する際に知っておくべきこと #aws #jawsug

AWS lambda メモ

タイトルでは

知っておくべきこと と書きましたが、簡潔に結論を書くと 仕様のドキュメントをちゃんと読めば問題なし となります。ドキュメント読むの大事ですね。

そして普段からちゃんと読んでる人はハマらないので、なんの気づきもない可能性があります。

実現したいこと

みんな大好きLambdaですが、Lambda関数の数が多くなり出力されるLogの量が多くなってくると、CloudWatch Logsのマネジメントコンソール上での検索が大変になってきました。

CloudWatch Logsのマネジメントコンソール上では、ログストリーム間のイベントを横断検索することはできますが、ロググループ間の横断検索や検索結果の直感的な可視化などを行うことができません。

これを構築と運用の手間をなるべくかけずに実現して、Lambda関数から出力されたLogを普通に検索して可視化したいわけです。

Lambda関数をまたいでLogを検索する必要がない！という場合は必要ない仕組みになります。

実現方法

実現するにために以下のサービスを連携して利用することを考えました

AWS Lambda
Amazon CloudWatch Logs
Amazon Kinesis Firehose
Amazon S3
Amazon Athena
Amazon QuickSight

具体的にはAWS Lambdaから出力されたLogがAmazon CloudWatch Logsに蓄積されるので、Amazon CloudWatch Logsのサブスクリプションを利用してAmazon Kinesis Firehoseにリアルタイムで出力しAmazon S3に蓄積する。

Amazon S3に蓄積されたLogをAmazon Athenaでクエリを投げられるようにしてAmazon QuickSightにて可視化を行う。

他の実現方法

上記の方法以外で以下のサービスを使えばもっと手軽に実現できます

Amazon Elasticsearch Service

Amazon CloudWatch Logsのサブスクリプションを利用してAmazon Elasticsearch Serviceにリアルタイムで出力し、Kibanaにて可視化を行う。

ただしAmazon Elasticsearch Serviceはストレージの容量が無制限ではなく、必要があれば設定や操作をしてストレージを管理しなければならないため今回はこの方法を選択しませんでした。

用途が合えば非常に手軽なのでこちらを選択するのもアリかと思います。

Amazon CloudWatch Logs

マネジメントコンソールから設定を行えるサブスクリプションは以下の2種類
- AWS Lambda
- Amazon Elasticsearch Service

サブスクリプションとしては以下の2種類も利用可能
- Amazon Kinesis Streams
- Amazon Kinesis Firehose

docs.aws.amazon.com

マネジメントコンソールから設定できないものについてはAWS CLI等で設定する

docs.aws.amazon.com

Amazon CloudWatch LogsのサブスクリプションでAmazon Kinesis Firehoseと連携する場合、すでにgizpで圧縮された状態で送信される

docs.aws.amazon.com

Data sent from CloudWatch Logs to Amazon Kinesis Firehose is already compressed with gzip level 6 compression, so you do not need to use compression within your Firehose delivery stream.

Amazon Kinesis Firehoseとの連携の場合はすでにgzipで圧縮された状態で送信されるとは知りませんでした・・・ドキュメントをしっかり読んで理解していれば、今回悩むことはなかったかもしれません

ここまでがAmazon CloudWatch Logsについて知っておくべきことになります

Amazon Kinesis Firehose

Amazon Kinesis FirehoseでAmazon S3に転送されたデータには改行がなく1行
Amazon Kinesis Firehose Data Transformationを利用して改行を追加する

docs.aws.amazon.com

Amazon Kinesis Firehoseの設定で"CompressionFormat" : "UNCOMPRESSED"とした場合には、ファイルには拡張子が付与されない

docs.aws.amazon.com

Amazon Kinesis Firehose Data Transformationを利用しなければ改行が追加できないのちょっと残念な感じがします・・・

AWS IoT ルールアクションでFirehose アクションを利用する場合にはseparatorの指定が可能で、これによって改行をした状態でデータが蓄積されます。この機能を通常のAmazon Kinesis Firehoseで利用出来たらいいなぁ

docs.aws.amazon.com

ここまでがAmazon Kinesis Firehoseについて知っておくべきことになります

Amazon Athena

Amazon Athenaで利用するには1行1レコードの形式にする必要がある
Amazon AthenaでGZIP圧縮されたファイルを読み込むには、ファイルの拡張子を*.gzにする必要がある
実際にGZIP圧縮されたファイルでも拡張子が正しくないと読み込めない
このためAmazon Kinesis Firehoseの設定で"CompressionFormat" : "UNCOMPRESSED"として出力されたファイルは拡張子が無いため正しく読み込めない
Amazon Athenaで利用するためには、Amazon Kinesis Firehose Data TransformationにてAmazon CloudWatch Logsから連携されたデータのGZIP解凍を行い、Amazon Kinesis Firehoseの設定で"CompressionFormat" : "GZIP"とし拡張子の*.gzが付与される形でAmazon S3に出力する必要がある

aws.typepad.com

Amazon Athena のパフォーマンスチューニング Tips トップ 10 | Amazon Web Services ブログ
https://aws.amazon.com/jp/blogs/news/top-10-performance-tuning-tips-for-amazon-athena/

ファイルの拡張子が*.gzでないとGZIPファイルを読み込んでくれないのはやっぱりちょっと残念な気が・・・S3オブジェクトのメタデータでContent-Typeを見て処理してくれるとかあるとステキなんだけどなぁ

ここまでがAmazon Athenaについて知っておくべきことになります

Amazon QuickSight

Amazon QuickSightのSign upを行えるのはIAMアカウント or Rootアカウント
Roleベースログイン、フェデレーションユーザーには未対応

docs.aws.amazon.com

今回利用していたアカウントがフェデレーションユーザーだったため、処理状態が変化せずに困りました・・・

フェデレーションユーザーでログインしていることは、システム側がわかっているはずなのでフェデレーションユーザーではNGというエラーメッセージが出てくれれば良いのになぁ

ここまでがAmazon QuickSightについて知っておくべきことになります

Amazon S3

AWS CLIのaws s3 cpコマンドでのファイル取得とマネジメントコンソール上からのダウンロードでのファイル取得では差異が出ることがある
ブラウザーの機能で*.gzファイルを自動で解凍してしまう事がある

利用していのはGoogle Chromeでしたが、このように自動解凍しているとは認識していませんでした・・・結果的にS3上のファイルとローカルにダウンロードしたファイルで状態に差異が出ることになり、大いに悩む原因の１つになりました

cp — AWS CLI 1.11.74 Command Reference
http://docs.aws.amazon.com/cli/latest/reference/s3/cp.html

ここまでがAmazon S3について知っておくべきことになります

手順

AWS Lambda関数から必要な情報をログに出力する
Amazon CloudWatch Logsにログが出力されているロググループを確認する
そのロググループに対してサブスクリプションとしてAmazon Kinesis Firehoseを指定する

gist.github.com

Amazon Kinesis Firehoseはマネジメントコンソール上では指定できないため、上記のようにAWS CLIを利用して設定した
Amazon Kinesis FirehoseのDelivery Streamは別途作成する必要がある
前述したようにCompressionの設定はGZIPとして、拡張子の*.gzが付与されるようにする
Data transformationをEnabledとしてLambda関数を指定する
このLambda関数も別途作成する必要がある
blueprintのkinesis-firehose-process-record-pythonを利用すれば簡単に作れる

gist.github.com

Amazon S3の指定バケットにAmazon Kinesis Firehoseからファイルが出力されていることを確認する
ファイルの拡張子は*.gzで、内容はAWS CLIのaws s3 cpコマンドを利用してローカルに取得して１行に１レーコドとなっているかを確認する
Amazon AthenaにてAmazon S3の該当バケットをTableのData setに指定して新しいテーブルを作る
作成したテーブルに投げたいクエリを作成する
Amazon QuickSightにSign upしてない場合はSign upする
この際ログインしているアカウント種別によっては処理が先に進まなくなるので気をつける
Amazon QuickSightにてデータソースにAmazon Athenaを選択し、作成したクエリーを選択すればデータが読み込まれ可視化される

これでAWS Lambdaのログを一元化して可視化することが出来るようになりました。料金には注意が必要ですが、性能や容量に関しては大きな心配はないのではないかなーと。

Amazon QuickSightはAmazon QuickSightだけ閲覧可能なユーザーなんかも作成可能なようなので、より柔軟にデータを見てもらうことができようになるのかなーと

また、各サービスがそれぞれ独立していても利用可能なので例えばAmazon QuickSightの調子が良くない場合でもAmazon Athena利用して確認するといったことも可能となるため、汎用性も高まる気がします。

まとめ

AWS Lambda→Amazon CloudWatch Logs→Amazon Kinesis Firehose→Amazon S3→Amazon Athena→Amazon QuickSightと長い連携でしたが、当初の目的通りに可視化することができました。

最初からしっかりとドキュメントを読んでいれば、余計な手間や迷惑をかけずに実現できていたと思うので、今後は詰まったら基本のドキュメントをしっかり読み込むようにしたいと思います。

一方で今回詰まった部分は、AWS側の標準機能として存在するば迷うこともないのになぁーと思うところもあります。特に、Amazon Kinesis Firehoseの改行付与と拡張子付与に関しては標準であっても良いかと思いました。

また、Amazon QuickSightのSign upのように、そもそもログインしているアカウント種別でNGの場合はエラーメッセージにその旨出て欲しいです・・・さすがに設定中の状態が延々と続くのはちょっと・・・

ヘルプドキュメントのリンクと共にエラーメッセージに出ていれば自分で原因に気がつけます。

AWSは進化も変化も速いのでこう言った細かいところの改良が進んでいくのを楽しみにしています！

AWSサポート

今回も大変お世話になったAWSサポート。利用する立場が違うと評価も違うのかもしれませんが、エンドユーザーとして利用することが多いので毎回非常に助かっています！いつもありがとうございます。

以上になります。

便利な

作ったのは

やってること

ダメだったこと

まとめ

画像を

もっと手軽に

この方法の良いところ

きっかけは

書いたのは

書いてみて

まとめ

知ってますか？

APIはあるけど・・・

そこで

とりあえず

分かりにくいところ

作ってみて

まとめ

なぜAzureか？

オンライントレーニング

microsoft learning accountの取得

無料のAzureアカウントの取得

オンライントレーニング 実践編

まとめ

よかったところ

もうちょっとカイゼン希望

決まりごと

今回は

発表中は

まとめ

宣伝

タイトルでは

実現したいこと

実現方法

他の実現方法

Amazon CloudWatch Logs

Amazon Kinesis Firehose

Amazon Athena

Amazon QuickSight

手順

まとめ

AWSサポート

オンライントレーニング実践編