
در این مصاحبه اختصاصی به بررسی می پردازیم تومر شیران سفر از شکل دادن به جنبش داده های بزرگ در MapR تا تأسیس Dremio، یک رهبر در فضای لیک هاوس داده. تومر بینشهایی در مورد نوآوریها در معماری باز و هوش مصنوعی، استراتژیهایی که باعث موفقیت Dremio میشوند، و چشمانداز خود برای آینده تجزیه و تحلیل دادهها را به اشتراک میگذارد. کشف کنید که Dremio چگونه به کسبوکارها قدرت میدهد تا پتانسیل کامل خود را باز کنند و نحوه استفاده سازمانها از دادههای خود را دوباره تعریف کنند.
شما در شکلدهی به سفر Dremio و فناوری اصلی آن از زمان پیدایش آن نقش مهمی داشتهاید. آیا میتوانید به اشتراک بگذارید که چه چیزی الهامبخش شما شد تا به طور خاص به فضای دریاچه دادهها بپردازید، و چگونه این دیدگاه تکامل یافت؟
زمانی که Dremio را تأسیس کردم، الهام من ناشی از ناامیدی مداومی بود که در حین کار با سیستم های داده سازمانی مشاهده کردم – و تجربه کردم. در MapR، دیدم که دسترسی شرکتها، تجزیه و تحلیل و کسب ارزش از دادههایشان چقدر پیچیده و ناکارآمد است. سازمانها زمان و پول زیادی را صرف انتقال دادهها بین سیستمها میکردند، خود را در پلتفرمهای اختصاصی قفل میکردند، و تلاش میکردند تا بینشهایی را با سرعت کافی برای همگام شدن با نیازهای تجاری ارائه دهند. من می خواستم این مشکلات را با ایجاد یک پلتفرم که انعطاف پذیری دریاچه های داده را با عملکرد بالا و سهولت استفاده که به طور سنتی با انبارهای داده مرتبط است، حل کنم.
من همیشه به قدرت دادهها در تغییر سازمانها اعتقاد داشتهام، اما این تحول تنها زمانی امکانپذیر است که دادهها در دسترس و قابل اجرا باشند. من راه حلی را متصور شدم که موانع کار با داده ها را از بین ببرد – حذف اتکا به فرآیندهای سنتی ETL، کاهش هزینه ها و امکان بینش در زمان واقعی به طور مستقیم از منبع. این چشم انداز پایه و اساس Dremio شد.
با ساختن یک پلت فرم لیکهاوس داده باز، ما این امکان را برای سازمانها فراهم کردهایم که از دادههای خود بدون حمل و نقل یا برخورد با قفل فروشنده استفاده کنند. فناوری هایی مانند Apache Iceberg و Apache Arrow برای این ماموریت حیاتی هستند و من مفتخرم که Dremio نقش اصلی را در توسعه آنها ایفا کرده است. این نوآوری ها نشان دهنده تعهد من به توانمندسازی شرکت ها با ابزارهایی برای بازگشایی پتانسیل کامل داده هایشان است که تجزیه و تحلیل را نه تنها سریع تر و آسان تر، بلکه دموکراتیک تر و مقرون به صرفه تر می کند.
در MapR، شما به عنوان یکی از اعضای اولیه تیم در جنبش تجزیه و تحلیل داده های بزرگ نقش مهمی ایفا کردید. این تجربه چگونه روی رویکرد شما برای رهبری Dremio و توسعه ماموریت و ارزش های اصلی آن تأثیر گذاشت؟
در MapR، تجربه من به من آموخت که چقدر مهم است که سیستمهایی ایجاد کنم که هم قوی باشند و هم برای کاربران با تخصصهای فنی متفاوت قابل دسترسی باشند. در طول مدت حضورم در آنجا، از نزدیک متوجه چالش هایی شدم که شرکت های بزرگ با استقرار اولیه Hadoop با آن مواجه بودند. در حالی که این فناوری دارای پتانسیل عظیمی بود، بسیاری از شرکت ها فاقد ظرفیت مهندسی برای مدیریت موثر این سیستم های پیچیده بودند.
این درک رویکرد من به طراحی محصول و رهبری در درمیو را شکل داد. به عنوان مثال، من ارزش بسیار زیادی را در سادهسازی دسترسی به دادهها و در عین حال حفظ عملکرد و قابلیت اطمینان مورد نیاز در مقیاس دیدم. راهحلهای ایجاد برای شرکتها، نیاز به فناوریهایی را برجسته میکند که میتوانند شکافها را در قابلیت همکاری دادهها پر کنند و در عین حال به کاربران غیر فنی قدرت میدهند تا به راحتی بینشها را استخراج کنند. در MapR، این امر شامل حمایت از مشتریان در هنگام مبارزه با دادههای مخفی و پیچیدگیهای یکپارچهسازی قالبها و ابزارهای مختلف بود – چالشی که به شدت بر مأموریت Dremio برای دسترسی و عملی کردن دادهها بدون دخالت سنگین IT تأثیر گذاشت.
ایده خانه دریاچه داده ای که هم تجزیه و تحلیل سلف سرویس و هم هوش مصنوعی را بهینه می کند، جالب است. آیا میتوانید چالشهای فنی و سازمانی مربوط به ایجاد چنین پلتفرم واحدی را توضیح دهید و رویکرد Dremio را چگونه در این زمینه برجسته میبینید؟
از نظر فنی، چالشهای اولیه شامل اطمینان از اجرای پرس و جو با کارایی بالا، ادغام یکپارچه با اکوسیستمهای موجود، و مدیریت حاکمیت در معماریهای توزیعشده است. از نظر سازمانی، این در مورد ایجاد هماهنگی بین مهندسی داده و تیم های تجاری است. رویکرد Dremio با معماری باز خود – استفاده از Apache Iceberg برای تضمین آزادی داده – و تمرکز آن بر ارائه تجزیه و تحلیل سلف سرویس بدون مالیات کنجکاوی مدلهای مصرف ابری سنتی متمایز است.
Dremio همچنان به تقویت تعهد مستمر خود برای ارائه معماریهای خانه دریاچه باز، مقیاسپذیر و انعطافپذیر که یکپارچهسازی و تجزیه و تحلیل دادهها را در هر محیطی ساده میکند، ادامه میدهد. در نتیجه، مشتریان ما دیگر مجبور نیستند بین فروشندهها یا معماریها یکی را انتخاب کنند، زیرا میتوانند با کاتالوگ دلخواه خود ادغام شوند، به صورت on-prem، در فضای ابری، یا در یک معماری ترکیبی که قابلیت همکاری یکپارچه را در سراسر پلتفرمها تضمین میکند، امکان تجزیه و تحلیل یکپارچه را بدون استفاده از آن فراهم میکند. به یک فروشنده خاص گره خورده است.
انعطاف پذیری برای سازمان های مدرنی که به دنبال به حداکثر رساندن ارزش داده های خود هستند حیاتی است. Dremio به کسبوکارها این امکان را میدهد که معماری lakehouse خود را در هر کجا که مؤثرتر است به کار گیرند و ما 100% متعهد هستیم که به مشتریان آزادی انتخاب بهترین ابزارها و زیرساختها را بدهیم و در عین حال ترس از قفل شدن فروشنده را کاهش دهیم.
هوش مصنوعی مولد به سرعت در حال تغییر شکل صنایع است. از دیدگاه شما، سازمانها چگونه میتوانند از هوش مصنوعی مولد برای تغییر جریانهای کاری تجزیه و تحلیل دادهها استفاده کنند و چه قابلیتهای جدیدی را برای کاربران تجاری باز میکند؟
استفاده از قدرت هوش مصنوعی مولد برای متحول کردن گردشهای کاری تجزیه و تحلیل دادهها، هدف اکثر کسبوکارهای امروزی است، زیرا آنها به دنبال باز کردن قدرت هوش مصنوعی برای تجزیه و تحلیل یکپارچه دادهها هستند. هوش مصنوعی مولد می تواند این تلاش را به طور قابل توجهی شهودی تر کند و کاربران را قادر می سازد تا از طریق زبان طبیعی یا بینش های تولید خودکار با داده ها تعامل داشته باشند. برای مشاغل، این فرصتها را برای کشف الگوها و روندها بدون تخصص فنی عمیق باز میکند. این یک تغییر دهنده بازی برای دموکراتیک کردن دسترسی به داده است.
راهحل ما شامل ویژگیهای پیشرفته مبتنی بر هوش مصنوعی است که به کاربران تجاری امکان میدهد دادهها را با متن جستجو کنند، کاوش دادهها را بهبود ببخشند، و بینش را تسریع کنند. با این حال، این تنها شروع است زیرا ما در حال بررسی راههای اضافی برای جاسازی هوش مصنوعی مولد در جریانهای کاری، بهبود تجربیات کاربر و تسریع زمان برای بینش هستیم.
شما بر رشد Dremio از یک تیم کوچک به بیش از 100 کارمند نظارت کرده اید. چه استراتژی هایی در حفظ نوآوری و چابکی با گسترش تیم موثر بوده است و این فرهنگ را چگونه بر آینده Dremio تأثیر می گذارد؟
پرورش فرهنگ کنجکاوی و همکاری کلیدی بوده است. ما روی توانمندسازی تیمها برای تصاحب مالکیت، تشویق همسویی متقابل کارکردی، و حفظ ذهنیت استارتآپ تمرکز کردهایم، حتی در زمانی که مقیاسگذاری کردهایم. این به ما این امکان را میدهد که سریع تکرار کنیم، بر مشتری متمرکز بمانیم و در خط مقدم نوآوری صنعت باقی بمانیم.
“نیروی محرکه Dremio همیشه بهتر کردن است ارتباطات شفاف، مسئولیت پذیری و احترام سنگ بنای کارمندان ما هستند. طلسم ما “Gnarly the Narwhal” استانداردی را برای کارمندان Dremio (معروف به “Gnarlies”) تعیین می کند. ما دوست داریم با یک نگرش “غم انگیز” به شغل خود نزدیک شویم که ما را به دستیابی به نتایج بی سابقه ای سوق می دهد. Gnarlies ما روزانه این کار را انجام می دهند. ما همچنین معتقدیم که محل کار جایی است که Gnarlies ما می توانند در نظرات گوناگون شرکت کنند و در عین حال در یک ماموریت مشترک گرد هم آیند. نسل بعدی تجزیه و تحلیل داده ها را قادر می سازد.
ارزشهای اصلی ما اساس نحوه همکاری ما به عنوان یک تیم را تشکیل میدهد و ممکن است یکی از دلایلی باشد که Dremio به عنوان یکی از «بهترین مکانها برای کار در منطقه خلیج ۲۰۲۲» توسط San Francisco Business Times انتخاب شد.
توانایی کاربران تجاری برای پرس و جو از داده ها به زبان طبیعی، مرز جدیدی را در دسترسی به داده ها نشان می دهد. چه پیشرفتهای کلیدی تکنولوژیکی این امر را ممکن میسازد، و چه موانعی در ایجاد پرسوجوهای داده مبتنی بر متن به طور جهانی قابل اعتماد باقی میماند؟
پیشرفتها در مدلهای زبان بزرگ (LLM) و پایگاههای داده برداری، پردازش زبان طبیعی (NLP) را برای پرسشهای داده امکانپذیر کرده است. این فناوریها درک زمینه و هدف را امکانپذیر میکنند و پرسوجو را شهودیتر میکنند. با این حال، موانع شامل اطمینان از دقت، رسیدگی به پرس و جوهای مبهم، و مقیاس بندی به مجموعه داده های پیچیده است. چالش در اصلاح این مدل ها برای ارائه مداوم بینش دقیق و عملی نهفته است.
به نظر شما، اتوماسیون چه نقشی در افزایش اکتشاف داده و سرعت بینش برای شرکت ها خواهد داشت؟ آیا راهحلهای مبتنی بر اتوماسیون خاصی در Dremio وجود دارد که شما بهخصوص در مورد آن هیجانزده هستید؟
اتوماسیون در سادهسازی آمادهسازی دادهها، امکان کاوش سریعتر و شناسایی الگوهایی که در غیر این صورت ممکن است مورد توجه قرار نگیرند، بسیار مهم خواهد بود. در Dremio، من از اینکه چگونه فناوری ما بهینهسازی پرس و جو را خودکار میکند و با استانداردهای باز مانند Iceberg ادغام میشود تا تلاش دستی را کاهش دهد و در عین حال بینشها را سریعتر و کارآمدتر ارائه دهد، هیجانزده هستم.
با پیشینه ای که در زمینه مهندسی و مدیریت محصول دارید، چگونه به ایجاد تعادل بین پیشرفت فنی و طراحی کاربر محور نزدیک می شوید، به خصوص در مورد ایجاد ابزارهای تجزیه و تحلیل بصری؟
با درک عمیق نیازهای کاربر شروع می شود – گوش دادن به بازخورد و مشاهده نحوه استفاده از ابزارهای ما. ایجاد تعادل بین نوآوری فنی با سادگی بسیار مهم است. در Dremio، چشمانداز دائمی ما این است که اطمینان حاصل کنیم که حتی پیشرفتهترین ویژگیهای ما در دسترس و شهودی هستند و کاربران را بدون نیاز به متخصص دادهها توانمند میسازند.
مدلهای کسبوکار تکنومرکز امروزی نیاز به هوش مصنوعی و معماری تحلیلی موفق را نشان میدهند. به عبارت ساده تر، آسان کردن کار برای کاربران یک جدول است و شکست یک گزینه نیست.
با نگاهی به آینده خانههای دریاچه داده، به نظر شما چه روندها یا فناوریهای نوظهوری در پنج سال آینده متحولتر خواهند بود، بهویژه که به مقیاسسازی قابلیتهای هوش مصنوعی در مشاغل مربوط میشوند؟
من سه روند دگرگون کننده را می بینم: افزایش داده های آماده هوش مصنوعی، پیشرفت در تجزیه و تحلیل بلادرنگ، و پذیرش رو به رشد معماری های داده باز مانند Apache Iceberg. این روندها به کسبوکارها کمک میکند قابلیتهای هوش مصنوعی را افزایش دهند، هزینهها را کاهش دهند و دادهها را عملیتر کنند. Dremio در خط مقدم این تکامل قرار دارد و پلتفرم هایی می سازد که هم آینده نگر و هم انعطاف پذیر هستند.
شما همچنین دو وب سایت با پایگاه کاربری قابل توجهی تأسیس کرده اید. این تجربه چگونه روی رویکرد شما برای توسعه محصول و مشارکت مشتری در فناوری سازمانی تأثیر گذاشته است، و آیا شباهت های شگفت انگیزی بین ساختن برای مصرف کنندگان و شرکت ها وجود دارد؟
ساخت وب سایت های مصرف کننده اهمیت طراحی کاربر محور و قدرت یک تجربه یکپارچه را به من آموخت. در حالی که شرکت ها نیازهای پیچیده تری دارند، اصول اساسی سادگی، تعامل و پاسخگویی یکسان باقی می مانند. در هر دو حوزه، موفقیت به حل موثر مشکلات واقعی و تضمین ارتباط قوی با مخاطبان بستگی دارد.