SQL

ゼロ年代後半ゆるふわ情報系学生がSQLのクラスタリングをやってみた

インフラチームの山口です。 ゼロ年代後半ゆるふわ情報系学生でしたが紆余曲折の末にインフラエンジニア1年目となりました。 今回は編集距離を使用してSQLのクエリをクラスタリングしてみたので記事にまとめてみます。 奇しくも、伊藤直也さんのブログで編集…

Apache Airflow で実現するSQL ServerからBigQueryへのデータ同期

はじめに この記事はEnigmo Advent Calendar 2018の11日目です。 Enigmoでは、データウェアハウス(DWH)としてBigQueryを使っていて、サービスのアクセスログやサイト内の行動ログ、データベースのデータをBigQueryへ集約させています。 データベースからBi…

SQLでバスケット分析(信頼度・リフト値算出)を実行

はじめに こんにちは。2018年9月入社でデータ分析担当の@Tawasshyです。 この記事はEnigmo Advent Calendar 2018の3日目です。 弊社ではファッションECサイトであるBUYMAを展開しております。 売り手となるバイヤー(パーソナルショッパー)は世界中に在住して…