一般社団法人 全国個人事業主支援協会

MEMBER メンバー

  • 前回記載した、pysparkの環境構築時に実行する以下のコマンドでエラーが出るようになったので解決方法を備忘録として記載する。

    spark = SparkSession.builder
    .master(“local[1]”)
    .appName(“knock”)
    .getOrCreate()
    エラー内容
    Py4JJavaError: An error occurred while ca[…]

  • pysparkをライトに使用するため、JupyterLabでのpyspark環境構築方法を記載する。

    1. JupyterLabを起動する

    2. 以下のコマンドでpysparkとJDKをインストールする

    !pip install –upgrade pip
    !pip install pyspark
    !conda install openjdk

    3. pyspark.sqlのSparkSessio[…]

  • 業務でpysparkを使う機会があり、自宅の環境でも使えるように環境構築した際の手順を備忘録として記載する。
    ※OSはMac

    JAVAのインストール(sparkはJVM上で動作するため)
    $ brew search openjdk
    condaをインストールしていれば以下でも可能
    $ conda install[…]

  • 今回はテーブルを結合について記載する。
    テーブルの結合方法
    テーブルの結合にはjoinという句を使用する。
    結合の方法には様々あり、用途によってした図のようなjoinを使い分ける必要がある。※ 図の⚪︎はテーブルを表す

    出典:https://developers.google.com/ads-data-hub/marketers/guides/best-practices?hl=ja

     
    joinの[…]

  • 今回はサンプルデータを使用したHAVING句の実行について記載する。
    使用データ
    無料で使用できるデータセット「chicago_crime」データセットのテーブル「crime」を使用する。
    これは、シカゴで起こった犯罪のデータである。
    カラム「primary_type」は犯罪種別を表しており、GROUP BY句で分類すると36種類に分類されていることが分かる。

     
    HAVING句による条件指定
    サンプ[…]

  • 今回はHAVING句について記述する。
    HAVING句とは
    HAVING句はクエリの条件指定に使用する。
    同じく条件指定に使用できるWHERE句との違いは実行のタイミングであり、HAVING句はGROUPBYの後に実行される。

    HAVING句の使用用途
    HAVING句は、上記の通りGROUP BYの後に実行されるため
    WHERE句と異なり集計されたフィールドに対して条件指定可能で、
    このとき、SELECT句で[…]

  • 少し前に話題になったチャット生成AIのChatGPTを業務で使用する機会があったので使用するまでの手順をまとめてみました。

    手順1 ChatGPTの作成元であるOpenAIのサイトにアクセス

    手順2 Try ChatGPTをクリック

    手順3 アカウントを持っていない場合はSign UPをクリック

    手順4 パスワードを入力するか、[…]

  • 今回は前回に引き続き集約関数について記述する

    ・COUNT
    指定したカラムのカウントを取得(NULLは除く)
    「*」を指定した場合はテーブルのレコード数を取得する(NULLを含む)

    使用例1:商品テーブルのレコード数を取得する
    SELECT COUNT(*) FROM 商品テーブル

    使用例2:商品別のレコード数を取得する
    SELECT 商品, COUNT(*) FROM 商品テーブル GROUP BY[…]

  • 今回は、テーブルの全レコードまたはグループ化されたグループごとの集約値を返す集約関数について記載する。
    GROUP BYでグループ化した要素の様々な結果を取得する集約関数について記載する。
    集約関数とは
    指定したカラムの値の集合についての集約値を返却する関数。
    集約関数には、様々な種類がありGROUP BY句が[…]

  • 今回は、データのグループ化を行うGROUP BY句について記載する。
    使用するデータ
    今回は、無料で使[…]

  • 今回は、ORDER BYによる並べ[…]

  • 今回は、クエリの実行結果を並べ替える方法を記載する
    取得するデータ
    今回は、無料で使用できるデータセット「bigquery-public-dataset」のテーブル「bigquery-public-data.google_ads.geotargets」からカラム「parent_id」「criteria_id」「en_name」を取得する。

    上記を取得するクエリは以下。

    SELECT
      parent_id,[…]

  • 紆余曲折を経てようやく確定申告提出しました。
    提出については、e-Taxに必用な利用者識別番号だとか会計ソフトのスマホアプリのインストールを事前
    に準備できたのでスムーズに対応できました。e-Taxは各証明書の添付も省略でき、会計ソフトを使えば初めてでも数分で提出できました。(というか手書き郵送で対応している人本当にすごい。)
    最後に資料をPDFで保存しつつ、来年に同じ目に遭わないように帳簿の作成方法を忘れずにメモして今[…]

  • Kyotaです。

    先月から始めた確定申告の書類作成ですが、何とか完了しあとは2/16以降に忘れずに提出するだけになりました。

    自分は、青色での申告だったため、複式簿記による帳簿付が必用であり慣れるまで非常に苦労し諦めかけました…

    ただ帳簿の付け方、勘定科目の分類、難しい減価償却の計算方法etc..全てネットで自力で調べられるため、時間はかかりましたが最大限節税することができました。

    確定申告の書類につい[…]

  • 12月、サラリーマン時代なら今頃年末調整のための書類の提出していたなーとふと思い出し確定申告の準備について考え始める。

    独立して9ヶ月毎月こつこつと帳簿を作っていれば楽だなと頭では理解しつつ、結局重い腰が上がらず今に至った訳だが、複式簿記の帳簿の付け方が全く分からず焦る。。

    また経費も現金で購入したものの領収書は保存してあったが、ネットで購入したもの、口座から引き落とされるもの、家事按分とするものetc..いざ考え[…]

  • 前回は、WHERE句の条件を複数指定するための方法を記載したが、今回はWHERE句で条件指定の際に頻繁に使用する論理演算子について記載する。
    論理積(AND)
    「条件1 AND 条件2」のように使用し、条件1,2双方を満たすレコードが取得される。
    論理和(OR)
    「条件1 OR 条件2」のように使用し、条件1,2どちらかを満たすレコードが取得される。
    論理否定(NOT)
    「NOT 条件」のように使用し、条件の否定を[…]

  • 今回は、WHERE句の取得条件を複数指定する方法を記載する。
    取得するデータ
    前回同様無料で使用できるデータセット「bigquery-public-dataset」のテーブル「ga_sessions_20170801」を使用する。
    WHERE句での複数条件指定
    WHERE句の条件を複数指定するには、論理演算子(AND・ORなど)で条件を繋いで記述する。
    例えば「条件AかつB」を満たすレコードのみを取得したい場合は以下[…]

  • 今回は、テーブルから取得するデータに条件を指定する方法を記載する。
    取得するデータ
    前回同様無料で使用できるデータセット「bigquery-public-dataset」のテーブル「ga_sessions_20170801」を使用する。
    条件を指定してデータを取得
    取得条件は、以下のようにSELECT句、FROM句の後にWHERE句を追加し、その中で条件を指定する。

    SELECT
    “カラム名”
    FROM
    “[…]

  • 今回は、テーブルからデータを取得する方法を記載する。
    取得するデータ
    無料で使用できるデータセット「bigquery-public-dataset」のテーブル「ga_sessions_20170801」を使用する。

    テーブルの定義等の情報を確認するには、BigQuery上のエクスプローラから「ga_sessions_20170801」を選択することで確認することができる。

    テーブルのデータを取得する
    テー[…]

  • 今回はBigQueryでローカルのCSV等のファイルデータを投入するためのテーブル作成方法を記載する。
    BigQueryの構成
    BigQueryは大まかに「プロジェクト」「データセット」「テーブル」の構成になっており、イメージとしては、プロジェクトの中に複数のデータセットが存在し、データセットの中に複数のテーブルが存在すると考えるとわかりやすい。
    プロジェクト
    データセット、テーブルを格納している抽象的なコンテナ。[…]

  • さらに読み込む
一覧へ戻る