نویسنده (ها): آیشواریا
در ابتدا منتشر شده در به سمت هوش مصنوعیبشر
داستان پردازی داده های قوی فراتر از تجسم اعدادی است که کشف می کند معنی در پشت الگوهای ، وضوح به آنچه در غیر این صورت فقط صفحه گسترده ای از ارزش ها خواهد بود.
در حالی که کتابخانه های تجسم مانند Matplotlib ، Plotly و Seaborn می توانند نمودارهای زیبایی تولید کنند ، آنها اغلب فاقد یک ویژگی مهم هستند: روایتبشر آنها آن را به بیننده واگذار می کنند تا داستان را در پشت خطوط و میله ها تفسیر کنند.
اینجاست که Altair و کتابخانه Pynarrative می درخشند. با هم ، آنها به ما کمک می کنند نه تنها داده ها را تجسم کنیم – بلکه در واقع توضیح دادن آن
Altair چیست؟
ارباب یک کتابخانه پایتون برای تجسم داده های اعلانی است که به کاربران امکان می دهد نمودارهای تمیز ، مختصر و تعاملی را بر اساس دستور زبان گرافیک Vega-Lite ایجاد کنند.
شما فقط باید ارائه دهید:
- داده های شما (به طور معمول a فریم داده های پاندا یا وگا مجموعه داده ها)
- نوع نمودار (به عنوان مثال ، نوار ، خط ، پراکندگی)
- رمزگذاری (محورهای x/y ، رنگ ، اندازه و غیره)
- تعامل اختیاری ، فیلتر و ابزار ابزار
Altair سپس با استفاده از مشخصات JSON ، تجسم را ارائه می دهد – آماده استفاده در داشبورد ، نوت بوک ، برنامه های وب یا گزارش ها.
کتابخانه Altair به طور مستقیم با پاندا (برای کار با داده ها) و Vega-Lite (برای ارائه و تعامل) ادغام می شود ، و این کار را برای کاربران پایتون آسان می کند تا داستانهای داده قدرتمند را بدون نوشتن کد ترسیم پیچیده ایجاد کنند.
pynarrative چیست؟
وابسته به پینار یک کتابخانه پایتون است که به طور خودکار خلاصه های روایت شفاف و روشنگری را از پاندا تهیه می کند dataframes و نمودارهای Altair.
فقط با چند ورودی:
- یک مجموعه داده (اغلب یک سری زمانی یا داده های ساختاری در یک DataFrame)
- تجسم (ایجاد شده با استفاده از Altair)
- برچسب های محور ، زمینه اختیاری و پیام مورد نظر شما
Pynarrative یک توضیح متنی خوب ساختار یافته ایجاد می کند-ایده آل برای تعبیه در داشبورد ، گزارش ها ، ارائه ها یا داستانهای داده تعاملی.
ساخته شده برای کار یکپارچه با پاندا (برای کار با داده ها) و Altair (برای ارائه بصری) ، Pynarrative کمک می کند تا شکاف بین داده های خام و بینش های قابل خواندن انسان را ایجاد کند-تبدیل تجسم به روایت های قانع کننده با حداقل تلاش.
توضیحات داده ها:
ما از مجموعه داده های Cars استفاده می کنیم ، که حاوی اطلاعاتی در مورد مدل های مختلف اتومبیل است. ویژگی های اصلی که ما روی آن تمرکز خواهیم کرد عبارتند از:
- اسب بخار: قدرت موتور ماشین.
- miles_per_gallon (mpg): ماشین چقدر کارآمد است.
- مبدا: جایی که ماشین ساخته شد (ایالات متحده ، اروپا یا ژاپن).
- نام: نام مدل ماشین.
این ویژگی ها به ما کمک می کند تا رابطه بین قدرت خودرو و راندمان سوخت را کشف کنیم ، و اینکه چگونه با مبدأ متفاوت است.
تمیز کردن و تهیه داده ها
ما شروع خواهیم کرد بارگیری خودکار مجموعه داده ها با استفاده از Seaborn ، سپس آن را برای تجسم های ما تمیز کنید.
import pandas as pd
import seaborn as sns
import altair as alt
import pynarrative as pndf = sns.load_dataset('mpg')
print(df[['name', 'mpg', 'horsepower', 'origin']].head())
خروجی:
مراحل تمیز کردن:
- برای رسیدگی به هرگونه مسائل احتمالی ، اسب بخار را به عددی تبدیل کنید.
- ردیف ها را با مقادیر گمشده در زمینه های بحرانی
df['horsepower'] = pd.to_numeric(df['horsepower'], errors='coerce')df_clean = df.dropna(subset=['horsepower', 'mpg', 'origin'])
print(df_clean[['name', 'mpg', 'horsepower', 'origin']].head())
خروجی:
داستان 1: قدرت در مقابل راندمان سوخت
بیایید رابطه بین موتور موتور خودرو (اسب بخار) و راندمان سوخت آن (مایل در هر گالن) را بررسی کنیم.
با کدگذاری رنگ ، نقاط داده بر اساس منطقه مبدا خودرو ، ما بینشی در مورد چگونگی نزدیک شدن کشورهای مختلف به طراحی خودرو می گیریم.
chart = pn.Story(df_clean).mark_circle(size=60).encode(
x='horsepower:Q',
y='mpg:Q',
color='origin:N',
tooltip=['name', 'horsepower', 'mpg', 'origin']
).add_title(
"Horsepower vs MPG by Origin",
"Higher horsepower often leads to lower fuel efficiency",
title_color="#1a1a1a",
subtitle_color="#4a4a4a"
).add_context(
text=[
"Cars with more horsepower generally consume more fuel.",
"Japanese and European models show a clear emphasis on fuel efficiency.",
"This trend reveals differing consumer needs and manufacturer strategies."
],
position="bottom",
dx=0,
color="black"
).render()chart
خروجی:
این تجسم نشان می دهد که ماشین های آمریکایی تمایل به داشتن اسب بخار بالاتر اما مصرف سوخت پایین تر ، در حالی که اتومبیل های ژاپنی و اروپایی تعادل بیشتری را نشان دهید.
داستان 2: روند کارآیی منطقه ای با گذشت زمان
بیایید مشاهده کنیم که چگونه راندمان سوخت (MPG) با گذشت زمان در مناطق مختلف تغییر کرده است.
# Estimate year from model_year column
df_clean['year'] = df_clean['model_year'] + 1900
# Compute average MPG by region and year
regional_avg = df_clean.groupby(['year', 'origin'])['mpg'].mean().reset_index()
chart = pn.Story(regional_avg).mark_line(point=True).encode(
x=alt.X('year:O', axis=alt.Axis(title='Year')),
y=alt.Y('mpg:Q', title='Average MPG'),
color='origin:N'
).add_title(
"Average Fuel Efficiency by Region Over Time",
"Trends in MPG from 1970s to 1980s",
title_color="#1a1a1a",
subtitle_color="#4a4a4a"
).add_context(
text=[
"Japanese cars consistently lead in fuel efficiency.",
"U.S. manufacturers ramped up efficiency post-1975.",
"European models maintain a steady middle ground."
],
position="bottom",
dx=0,
color="black"
).render()
chart
خروجی:
ما می بینیم چگونه تغییرات نظارتی و بحران سوخت تحت تأثیر بازده سوخت ، به ویژه در ایالات متحده
داستان 3: تأثیر بحران نفتی 1973
بیایید نمودار خود را با بحران نفت 1973، یک لحظه مهم برای طراحی ماشین.
chart = pn.Story(regional_avg).mark_line().encode(
x='year:O',
y='mpg:Q',
color='origin:N'
).add_title(
"Impact of the 1973 Oil Crisis on MPG",
"Shift in design philosophy after fuel shortages",
title_color="#1a1a1a",
subtitle_color="#4a4a4a"
).add_context(
text=[
"The 1973 Oil Crisis increased focus on fuel efficiency worldwide.",
"U.S. automakers shifted designs to improve MPG post-crisis.",
"Japanese models were already MPG leaders at the time."
],
position="bottom",
dx=0,
color="black"
).add_annotation(
1973, 15.5, "1973 Oil Crisis",
arrow_direction='up',
arrow_dx=0,
arrow_dy=-1,
arrow_color='red',
arrow_size=50,
label_color='black',
label_size=14,
show_point=True
).render()chart
خروجی:
این تجسم حاشیه نویسی می افزاید زمینه تاریخی، نشان دادن چگونگی رویدادهای جهانی روندهای صنعت را شکل می دهدبشر
به طور خلاصه
با استفاده از Pynarrative و Altair ، ما یکپارچه داده های عملکرد ماشین را به داستانهای جذاب بصری تبدیل کردیم:
- برجسته کردن رابطه معکوس بین اسب بخار و راندمان سوخت
- کاوش در مورد چگونگی شکل گیری فلسفه های طراحی منطقه ای با گذشت زمان اقتصاد سوخت
- حاشیه نویسی از وقایع مهم تاریخی مانند بحران نفت در سال 1973 برای نشان دادن تأثیر صنعت خود
همه اینها با استفاده از یک رابط واحد و بصری با ترکیب پاندا ، آلتیر و پینار انجام شد. هنگامی که این خط لوله قصه گویی در جای خود قرار گرفت ، می توان آن را با هر مجموعه داده ای که از طریق Altair از خودرو گرفته تا مراقبت های بهداشتی و فراتر از آن تهیه شده است ، سازگار کرد.
این رویکرد سریعتر ، مقیاس پذیر تر و شهودی تر از روشهای نمودار دستی معمولی است. این که آیا شما در حال ساختن گزارش های فنی ، داشبورد پویا یا روایت های بینش محور هستید ، این به عنوان پایه ای قابل اعتماد برای داستان پردازی داده های مؤثر است.
من دوست دارم نظرات شما را بخوانم!
منتشر شده از طریق به سمت هوش مصنوعی