MITRA__tech's profile picture. 未経験からAI・データ人材になるための情報発信します!!

MITRAtech

@MITRA__tech

未経験からAI・データ人材になるための情報発信します!!

10/15【先着3名限定】実務未経験者向けpython学習:IT業界の業界理解と需要爆発中のデータサイエンスについてお話しします。データサイエンス向けプログラミングを体験してみましょう!統計基礎動画プレゼント中!! techplay.jp/event/921222?u… #techplayjp


🔥【データ分析日課 No.15】🔥 こんにちは😃 今日は皆さんおなじみのカリフォルニア住宅価格のデータフレームを分析しました。 ラッソ回帰によって、特徴量の重要度を可視化した左図と、特徴量の散らばり具合の右図を見ると、重要度も少ないし外れ値も大きい、totalroomやhouseholdはいらないかも。

MITRA__tech's tweet image. 🔥【データ分析日課 No.15】🔥
こんにちは😃
今日は皆さんおなじみのカリフォルニア住宅価格のデータフレームを分析しました。

ラッソ回帰によって、特徴量の重要度を可視化した左図と、特徴量の散らばり具合の右図を見ると、重要度も少ないし外れ値も大きい、totalroomやhouseholdはいらないかも。
MITRA__tech's tweet image. 🔥【データ分析日課 No.15】🔥
こんにちは😃
今日は皆さんおなじみのカリフォルニア住宅価格のデータフレームを分析しました。

ラッソ回帰によって、特徴量の重要度を可視化した左図と、特徴量の散らばり具合の右図を見ると、重要度も少ないし外れ値も大きい、totalroomやhouseholdはいらないかも。

🍀【エンジニアあるある】🍀 優れている人を”つよつよ”って言いがち #理系 #エンジニア #データサイエンス


🔥【データ分析日課 No.13】🔥 今日は面白い描画ライブラリのplotlyのexpressメソッドを使用して世界地図視点で人口の偏りを可視化しました。 🇨🇳中国と🇮🇳インド人多っ! また今日もmatplotlibの描画で遊んでしまいましたね( ͈̄ _ ͈̄ )ハンセイ💦 🙅 現在カテゴリーデータの前処理に苦戦中

MITRA__tech's tweet image. 🔥【データ分析日課  No.13】🔥
今日は面白い描画ライブラリのplotlyのexpressメソッドを使用して世界地図視点で人口の偏りを可視化しました。

🇨🇳中国と🇮🇳インド人多っ!

また今日もmatplotlibの描画で遊んでしまいましたね(   ͈̄  _   ͈̄  )ハンセイ💦

🙅
現在カテゴリーデータの前処理に苦戦中

🔥【データ分析日課 No.11】🔥 遅くなってすみません、皆様お待ちかねの日課です‼️ 今回は、No.9で示したuniqueの少ない変数だけを抽出してダミー変数化を行い、年収に対する重要度を調べました。💰 会社規模と年次が重要度が高いように見えます✨ 次回はすべてのデータを含めて分析を試みます🔥

MITRA__tech's tweet image. 🔥【データ分析日課 No.11】🔥
遅くなってすみません、皆様お待ちかねの日課です‼️

今回は、No.9で示したuniqueの少ない変数だけを抽出してダミー変数化を行い、年収に対する重要度を調べました。💰
会社規模と年次が重要度が高いように見えます✨

次回はすべてのデータを含めて分析を試みます🔥

🔥【データ分析日課 No.10】🔥 今日から新しいデータを分析して可視化していきます。世界人口についてまとめられているデータを分析していきます🍀 まずは今得られている各国の人口割合を見てみると、やはり中国とインドはずば抜けてますね🤟 #データ分析 #データサイエンティスト #Python

MITRA__tech's tweet image. 🔥【データ分析日課 No.10】🔥
今日から新しいデータを分析して可視化していきます。世界人口についてまとめられているデータを分析していきます🍀

まずは今得られている各国の人口割合を見てみると、やはり中国とインドはずば抜けてますね🤟

 #データ分析
 #データサイエンティスト 
  #Python

🔥【データ分析日課 No.9】🔥 本日は、salary_in_usdに対して影響を与えてる要素を分析しようと試みましたが、データの前処理でつまづいてしまいました…😭 uniqueが絶妙に多い場合、ダミー変数化はどのように行えばいいのでしょうか? まだまだ🔰なので、頑張ります! #データサイエンス

MITRA__tech's tweet image. 🔥【データ分析日課 No.9】🔥
本日は、salary_in_usdに対して影響を与えてる要素を分析しようと試みましたが、データの前処理でつまづいてしまいました…😭

uniqueが絶妙に多い場合、ダミー変数化はどのように行えばいいのでしょうか?

まだまだ🔰なので、頑張ります!
#データサイエンス

🔥【データ分析日課 No.8】🔥 本日は引き続きデータサイエンティストたちのデータを扱っていきます! これはマットプロットライブラリのpairplotというメソッドで、各列の相関関係を示したグラフです🍀 丸で囲ったところを見ると、リモートワーク率が50%の会社は大企業が多いように見えますね😗

MITRA__tech's tweet image. 🔥【データ分析日課 No.8】🔥
本日は引き続きデータサイエンティストたちのデータを扱っていきます!
これはマットプロットライブラリのpairplotというメソッドで、各列の相関関係を示したグラフです🍀

丸で囲ったところを見ると、リモートワーク率が50%の会社は大企業が多いように見えますね😗

🔥【データ分析日課 No.7】🔥 今日はヒートアップで各要素の相関を描画してみました!色が薄いほど相関が強いことを示しています。 🇺🇸$換算の給与と相関が強いのは、雇用者の居住地と会社の所在地であるとわかります 働く場所が給与に直結しやすいということなのでしょうか…🤔 #データサイエンス

MITRA__tech's tweet image. 🔥【データ分析日課 No.7】🔥
今日はヒートアップで各要素の相関を描画してみました!色が薄いほど相関が強いことを示しています。

🇺🇸$換算の給与と相関が強いのは、雇用者の居住地と会社の所在地であるとわかります

働く場所が給与に直結しやすいということなのでしょうか…🤔

#データサイエンス

🔥【データ分析日課 No.6】🔥 今回はバイオリンプロットという描画方法で、データサイエンスに携わる方々の、リモートワーク割合ごとの給料を描画しました!👏 これを見ると、50%の方は単価が下がることがわかりますね🍀 中途半端にリモートワーク求めるのは給料や生産効率の低下に繋がるのかも❓

MITRA__tech's tweet image. 🔥【データ分析日課 No.6】🔥
今回はバイオリンプロットという描画方法で、データサイエンスに携わる方々の、リモートワーク割合ごとの給料を描画しました!👏

これを見ると、50%の方は単価が下がることがわかりますね🍀

中途半端にリモートワーク求めるのは給料や生産効率の低下に繋がるのかも❓

🔥【データ分析日課 No.5】🔥 今日は前回のデータを使って、データサイエンティストの国別平均収入をグラフ化してみました! これを見ると🇺🇸🇷🇺🇨🇦と有名国が上位ですが、意外と🇮🇱🇵🇷が1、2でした! 日本も10万$以上です! サンプル数や職位との関係までは分析できていないので、次回以降で行います🔥

MITRA__tech's tweet image. 🔥【データ分析日課 No.5】🔥
今日は前回のデータを使って、データサイエンティストの国別平均収入をグラフ化してみました!

これを見ると🇺🇸🇷🇺🇨🇦と有名国が上位ですが、意外と🇮🇱🇵🇷が1、2でした!
日本も10万$以上です!
サンプル数や職位との関係までは分析できていないので、次回以降で行います🔥

🔥【データ分析日課 No.4】🔥 今日はアメリカのデータサイエンスに携わる職種の人の給料について調べてみました! この箱ひげ図を見るとアメリカではデータアナリストを除く全てのデータサイエンス領域の仕事で75%の方が年収1000万円以上貰っていることがわかりますね!☺️

MITRA__tech's tweet image. 🔥【データ分析日課 No.4】🔥
今日はアメリカのデータサイエンスに携わる職種の人の給料について調べてみました!
 
この箱ひげ図を見るとアメリカではデータアナリストを除く全てのデータサイエンス領域の仕事で75%の方が年収1000万円以上貰っていることがわかりますね!☺️

今回は昨日のデータの中で都道府県別、出生率の上位10件をヒストグラムで表示してみました🍀 出生率は人口に比例すると考えられますが、残念ながらこのデータには人口のデータがないので関連性を描画することはできませんでした~😒

MITRA__tech's tweet image. 今回は昨日のデータの中で都道府県別、出生率の上位10件をヒストグラムで表示してみました🍀

出生率は人口に比例すると考えられますが、残念ながらこのデータには人口のデータがないので関連性を描画することはできませんでした~😒

🔥【データ分析日課 No.2】🔥 前回のデータをもとに都道府県の夫婦円満指数をグラフ化しました! 円満指数 = 婚姻件数÷離婚件数 と定義し、県別に並べました。 結果は… 🥇東京🥈富山🥉滋賀 です! グラフが少しぎこちなくなってしまったので次回は改善したいです‼️ #データサイエンス

MITRA__tech's tweet image. 🔥【データ分析日課 No.2】🔥

前回のデータをもとに都道府県の夫婦円満指数をグラフ化しました!
円満指数 = 婚姻件数÷離婚件数
と定義し、県別に並べました。

結果は…
🥇東京🥈富山🥉滋賀
です!

グラフが少しぎこちなくなってしまったので次回は改善したいです‼️
#データサイエンス

🔥【データ分析日課 No.1】🔥 今回は、2023年2月の都道府県別の人口動態調査のデータを整形しました‼ 次は、このデータを描画して、出生数と死亡数の差を描画して、視覚的に人口推移を確認してみます🍀 出典:政府統計の総合窓口(e-stat.go.jp#データ分析 #データサイエンス

MITRA__tech's tweet image. 🔥【データ分析日課 No.1】🔥

今回は、2023年2月の都道府県別の人口動態調査のデータを整形しました‼

次は、このデータを描画して、出生数と死亡数の差を描画して、視覚的に人口推移を確認してみます🍀

出典:政府統計の総合窓口(e-stat.go.jp)

#データ分析
#データサイエンス
MITRA__tech's tweet image. 🔥【データ分析日課 No.1】🔥

今回は、2023年2月の都道府県別の人口動態調査のデータを整形しました‼

次は、このデータを描画して、出生数と死亡数の差を描画して、視覚的に人口推移を確認してみます🍀

出典:政府統計の総合窓口(e-stat.go.jp)

#データ分析
#データサイエンス

Loading...

Something went wrong.


Something went wrong.