کد کلود به عنوان یک تحلیلگر داده: از صفر تا اولین گزارش


نویسنده (ها): فردی رابینسون

در ابتدا منتشر شده در به سمت هوش مصنوعیبشر

به عنوان تحلیلگران داده ما همه ما در آنجا بوده ایم ، درخواست مخوف برای ماهانه/سالانه [insert topic] گزارش ، یک کار اساسی که همچنین یک سینک زمان عظیم است.

افکار من برای هفته گذشته؟ “آیا نمی تواند فقط … این کار را انجام دهد؟” مطمئناً می تواند یک گزارش ساده تجزیه و تحلیل داده ها را شلاق بزند. درست است؟

بنابراین من تلاش خود را برای دیدن اینکه آیا واقعاً می توانم گزارش تجزیه و تحلیل دقیق مخاطبین مشتری را به طور خودکار انجام دهم تا با استفاده از کد Claude به پایان برسانم. در اینجا این داستان از چگونگی عبور از آشفتگی به یک پیش نویس اول شگفت آور صالح است.

کد کلود به عنوان یک تحلیلگر داده: از صفر تا اولین گزارشکد کلود به عنوان یک تحلیلگر داده: از صفر تا اولین گزارش

پیش نیازها

قبل از شیرجه رفتن ، کلمه ای در تنظیمات. اجرای کد Claude در محیط محلی خود ضروری است ، اما برای ارائه Claude Code Code True Data Analyst ، شما به ابزاری برای کد Claude نیز نیاز دارید تا بتوانید پایگاه داده خود را ایمن بخوانید و نمایش داده شد.

یک تن از نمونه های عالی منبع باز از این آنلاین وجود دارد ، فقط کافی است “MCP SQL Server” را جستجو کنید و یکی از مواردی را پیدا کنید که برای راه اندازی شما کار کند. حالا بیایید به قسمت سرگرم کننده برسیم.

تلاش 1: تحلیلگر داده بدون متن

اولین تلاش من یک تلاش خوش بینانه برای تصمیم گیری کامل به کد کلود به تنهایی بود. من یک فوریت ساده را به گپ انداختم:

## نقش

شما یک تحلیلگر داده متخصص و خود هستید کار ارائه تجزیه و تحلیل ماهانه در مورد دلیل تماس کاربران با ما است.

## کار

شما باید تجزیه و تحلیل را انجام دهید و تا پایان ژوئیه 2025 گزارشی را در مورد روند تماس بنویسید. شما باید از 12 ماه گذشته داده های تماس برای تجزیه و تحلیل روند استفاده کنید ، اما بیشتر روی تغییر حجم تماس/میزان تماس بین ژوئن و ژوئیه 2025 فهرست کنید. تجزیه و تحلیل خود را روی کدام نوع مخاطبین و چه میزان تماس بیشتر می کند و یا کاهش می یابد و چرا این روند اتفاق می افتد.

با کمال تعجب ، کد کلود تلاش کرد:

  1. نمایش داده شدگان SQL در حال ایجاد خطا بودند. Claude Code هیچ زمینه ای در مورد جداول صحیح برای مرجع ، ستون ها یا منظور از مقادیر چیست. این حدس و گمان را در همه جا ایجاد می کرد و مجبور می شد مرتباً خطاهای آن را برطرف کند.
  2. این نمایش داده شدگان نادرست نوشت. حتی اگر پرس و جو کار می کرد ، اغلب نادرست بود. به عنوان مثال ، تصمیم گرفت بهترین راه را برای محاسبه “کاربران فعال” حدس بزند و در نهایت با استفاده از ستون اشتباه برای حساب کردن به پایان رسید.

واضح است که نیاز به تصحیح هم در زمینه ای که ما آن را ارائه می دهیم و هم دستورالعمل های پیروی می کنیم.

بهبود زمینه

نکته مهم این است که در مورد زمینه ای که می خواهید به یک تحلیلگر داده جدید که به تیم شما پیوست ، فکر کنید و می خواستید آنها گزارش را بنویسند. چه چیزی را با آنها به اشتراک می گذارید؟ شما می توانید اطلاعات مربوط به جداول ، چند نمایش داده SQL را برای شروع کار و ساختار نمونه ای از گزارش به اشتراک بگذارید.

در اینجا اطلاعاتی که ما آن را منتقل خواهیم کرد:

  1. مستندات جدول. من به کلود لیستی از تمام جداول مربوطه و توضیحات مختصر و قابل خواندن انسانی برای هر ستون دادم. اگر به آن نمی گویید Contact_Reason_Id به چه معنی است ، فقط حدس می زنید.
  2. لیستی از نمایش داده های اصلی برای اجرا. اگر می دانید چه سؤالاتی را می خواهید به آن بپردازید که لیستی از نمایش داده های اصلی را برای اجرای انگلیسی ساده ارائه دهید ، دامنه زمینه مفقود شده عامل را به صورت انبوه کاهش می دهد و بر آنچه مهم است تمرکز کنید.
  3. چند نمونه از نمایشگاه SQL. بیشتر نمایش داده هایی که در یک جدول واحد اجرا می کنید بسیار شبیه به هم هستند ، و اغلب یک وضعیت یا ستون را تعویض می کنند. چند نمایش داده شده به طور قابل توجهی کیفیت پرس و جو را افزایش داد.
  4. راهنمای سبک نمودار. من برای نمودارها دستورالعمل هایی را برای استفاده از یک پالت رنگی ، از چه نوع نمودار و چه کاری با محورها انجام دادم.
  5. یک طرح تجزیه و تحلیل. من نمونه ای از گزارش قبلی را برای استفاده به عنوان ساختاری برای دنبال کردن ارائه کردم.

اسناد جدول

contact_id – شناسه منحصر به فرد مخاطب. می توانید مخاطبین را با این ستون حساب کنید.

contact_channel – کانال مشتری با ما تماس گرفته است. این می تواند تلفن ، ایمیل یا چت باشد.

Create_at_ts – زمان ایجاد تماس در. با این ستون می توانید مخاطبین را در سری زمانی تقسیم کنید.

این یک تغییر دهنده بازی برای خروجی آن بود ، ما نمایش داده شدگان صحیح ، تجسم شفاف و ساختار مستند سازگار داشتیم.

اما ما هنوز مشکلی داشتیم.

حتی با وجود این همه زمینه و لیست نمایش داده شدگان ، Claude Code هنوز کمی سرکش پیش رفت. این یک پرس و جو را اجرا می کند ، سپس یک پرس و جو دوم را اجرا می کند ، و سپس شروع به نوشتن تجزیه و تحلیل می کند پیش از تمام داده های لازم را جمع آوری کرده بود.

  1. سعی کرد چندین کار را به طور همزمان انجام دهد و غرق شد. تصمیم گرفت یک کار واحد را برای ایجاد و اجرای تمام نمایش داده های SQL به طور همزمان در یک نوت بوک انجام دهد ، این باعث ایجاد انواع درد از نظر کیفیت پرس و جو ، مشاهده و زمان بندی شد.
  2. از کارهایی که باید به طور مرتب دنبال شود دور شد. این تصمیم تصمیم گرفت که گزارش را پس از تولید چند پرس و جو SQL بنویسد ، بعید است که برای یک تحلیل خوب کافی باشد.

بهبود دستورالعمل های دنبال کردن

ما به راهی برای کنترل توجه کد کلود نیاز داشتیم تا این مرحله به مرحله به مرحله انجام شود. وقت آن بود که لیست Claude’s Todo را اجرا کنیم. همچنین به احتمال زیاد برای گردش کار طولانی تر که ممکن است مجبور شوید آن را در چندین جلسه کد Claude بشکنید. بنابراین ما می خواهیم یک لیست TOODO را انتخاب کنیم که می تواند در جایی که آخرین جلسه باقی مانده است انتخاب کند.

بنابراین ، سریع من ایجاد کردم یک گردش کار گام به گام برای آن بود که از آن پیروی کند که در یک حلقه تکراری بر روی هر یک از “وظایف در انتظار” پخته شود ، و پس از انجام کار در انتظار ، آن را به “کارهای کامل” در لیست TODO منتقل کرد.

پیشرفت بیشتر این بود که وظایف اصلی را به صورت جداگانه تقسیم کنیم. ایجاد نمایش داده ها و گزارش های نوشتن وظایف بسیار مشخصی است که از مجموعه مهارت های جداگانه استفاده می کنند ، بنابراین ما این گردش کار را به دو درخواست جداگانه در مورد یک مکالمه کلود تقسیم می کنیم.

با مجبور کردن آن برای پیروی از این جریان منطقی ، سرانجام آن را برای متوقف کردن بداهه سازی و پایبندی به برنامه کردم.

تلاش 2: سریع تر سریع تر

بنابراین ، پس از تمام این آزمایش و خطا ، سریعاً سریع به نظر می رسید؟

پیام اول – نویسنده پرس و جو

شما یک تحلیلگر داده های متخصص هستید که به طور مستقل کار می کنید. هدف شما ایجاد نمایش داده های SQL ، اجرای آنها و ایجاد نمودارها بر اساس نتایج است. شما باید بدون توقف ادامه دهید.

جدول اصلی برای داده های مخاطبین.

مستندات توضیح جداول داده ها. شما باید این را ابتدا بخوانید.

نمودارها باید از رنگهای مبتنی بر این پالت استفاده کنند: [‘#1f77b4’, ‘#ff7f0e’, ‘#2ca02c’, ‘#d62728’, ‘#9467bd’, ‘#8c564b’, ‘#e377c2’, ‘#7f7f7f’, ‘#bcbd22’, ‘#17becf’]

ابتدا بررسی کنید که آیا پرونده `ژوئیه_2025_analysis/todo.txt ‘وجود دارد یا خیر. اگر این کار را نکرد ، پوشه “JULY_2025_ANALYSYS” را ایجاد کنید و سپس `ژوئیه_2025_analysis/todo.txt` را با محتوای موجود در آن ایجاد کنید در زیر

پس از آماده شدن پرونده `todo.txt` ، یک حلقه اجرای را شروع خواهید کرد. شما باید این روند را ادامه دهید تا لیست “وظایف در انتظار” خالی شود. بین کارها متوقف نشوید. برای هر چرخه حلقه:

الف برای شناسایی کار بعدی ، پرونده `todo.txt` را بخوانید.

ب. اگر لیست “وظایف در انتظار” خالی است ، به مرحله نهایی بروید و پیامی را که تأیید می کند کل فرآیند کامل است ، خروجی کنید.

ج. اولین کار را از لیست “وظایف در انتظار” اجرا کنید.

د. پس از اتمام کار با موفقیت ، بلافاصله پرونده `ژوئیه_2025_analysis/todo.txt` را با انتقال توضیحات کار از بخش” وظایف در حال انتظار “به بخش” کار کامل “به روز کنید.

ه. بلافاصله چرخه حلقه بعدی را بدون توقف شروع کنید.

## وظایف در انتظار

1. بخوان `[docs_name]`برای درک طرح داده.

2. یک نوت بوک خالی Jupyter با نام `جولای_2025_analysis/contacts_analysis_july_2025.ipynb` ایجاد کنید.

3. ** پرس و جو 1: ** یک پرس و جو SQL برای “نرخ تماس ماهانه برای هر کاربر فعال” ایجاد کنید. پرس و جو را در نوت بوک اجرا کنید. یک نمودار دو محور ایجاد کنید (نوار برای کاربران ، خط برای نرخ). صرفه جویی در «ژوئیه_2025_analysis/01_contact_rate_per_user.png».

4. ** پرس و جو 2: ** [repeat the steps for query 1 for the remaining queries]

## کارهای کامل

دور دوم – نوشتن تحلیل

شما یک تحلیلگر داده های متخصص هستید که به طور مستقل کار می کنید. هدف شما ارائه تجزیه و تحلیل واضح در مورد روند داده ها است. شما گزارش های داده را مبتنی بر نمودارها می نویسید. دلایل روند داده را حدس بزنید ، فقط در مورد روند داده گزارش دهید. شما بدون توقف در کل لیست کار کار خواهید کرد. تحویل نهایی یک فایل .docx خواهد بود که حاوی تجزیه و تحلیل کتبی شما و کلیه نمودارهای پشتیبانی است.

یک گزارش مثال برای استفاده به عنوان الگویی برای سبک و ساختار.

1. ** تجزیه و تحلیل بنویسید: ** تجزیه و تحلیل کامل روند تماس را در یک پرونده جدید بنویسید: `ژوئیه_2025_analysis/contacts_analysis_july_2025.md`. تجزیه و تحلیل باید کاملاً از نمودارهای .png در پوشه ژوئیه_2025_Analysis مبتنی باشد و ساختار `را دنبال کند[example_analysis]`

2. ** Docx را تولید کنید: ** گزارش نهایی را با ترکیب متن از `contacts_analysis_july_2025.md` و همه نمودارهای ذخیره شده .png در یک پرونده .docx به نام` ژوئیه_2025_report.docx` تولید کنید.

چگونه کار کرد؟

خوب شد! در نهایت هوش مصنوعی قادر به تولید تمام نمایش داده شدگان/نمودارهایی بود که برای انجام و نوشتن تجزیه و تحلیل روند داده ها نیاز داشت.

در اینجا اصول کلیدی که آموخته ایم آورده شده است:

  1. آن را سوار بر آن کنید. صرف وقت برای تنظیم مستندات برای آن می تواند کمی زمان ببرد ، اما اگر این گزارش را به طور مرتب می نویسید ، کار سریع سود سهام را پرداخت می کند.
  2. لیست TODO کد CLAUDE را کنترل کنید. کلود از طریق لیست کار می کند ، از آن استفاده می کند تا به جای اینکه اجازه دهد در جهت خود خاموش شود ، گردش کار خود را کنترل کنید.

در اکتشافات بعدی ما کمی جسورانه تر می شویم. ما می خواهیم به کد کلود آزادی بیشتری بدهیم تا تصمیم بگیریم چه سؤالی برای جابجایی عمیق است. آیا می توانیم آن را از یک کارآموز خردسال به یک تحلیلگر سطح متوسط ​​خودکفایی ارتقا دهیم؟ با ما همراه باشید!

منتشر شده از طریق به سمت هوش مصنوعی



منبع: https://towardsai.net/p/data-analysis/claude-code-as-a-data-analyst-from-zero-to-first-report