
در کنفرانس Slush 2024، امیل ایفرم، بنیانگذار و مدیر عامل شرکت Neo4j، به اشتراک گذاشت که چگونه پایگاه داده های گراف انقلابی در تجزیه و تحلیل داده ها ایجاد می کنند. Neo4j، که مقر آن در دره سیلیکون است، به موارد استفاده حیاتی از تحقیقات اسناد پاناما در مورد فرار مالیاتی تا مأموریت ناسا به مریخ و پذیرش شرکتی از هوش مصنوعی مولد قدرت میدهد. Neo4j که به دلیل پایگاه داده نموداری و فناوری تجزیه و تحلیل خود برای کشف روابط در داده ها شناخته شده است، برای چالش های پیچیده مبتنی بر داده های مرتبط با برنامه های مدرن مانند کشف تقلب، زنجیره تامین و هوش مصنوعی مولد ضروری شده است، با پیش بینی گارتنر پذیرش گسترده تا سال 2025. در این مصاحبه. ، امیل در مورد منشاء منبع باز Neo4j، ادغام هوش مصنوعی و مشاوره برای مدیران عامل شرکت ها و استارت آپ ها صحبت می کند. بنیانگذاران، بینش های ارزشمندی را در مورد آینده نوآوری مبتنی بر داده ارائه می دهند.
در روزهای اولیه Neo4j چه چالش هایی وجود داشت که به فرصت هایی برای توسعه محصول و استراتژی های عرضه به بازار تبدیل شد؟
یکی از بزرگترین فرصتها و چالشها در روزهای اولیه این بود که چگونه یک شرکت را بر اساس یک محصول منبع باز ایجاد کنیم. ما از ابتدا نسخه جامعه Neo4j را داشتیم که رایگان و متن باز بود. هر کسی میتواند آن را دانلود کند، با آن آزمایش کند، و برنامههای کاربردی بسازد – حتی بدون نیاز به ثبت نام. این دسترسی یک جنبش مردمی ایجاد کرد. به عنوان مثال، در سال 2019، 500 رویداد مستقل مرتبط با Neo4j، مانند جلسات و وبینارها، برگزار شد که بیشتر آنها به صورت خودجوش توسط جامعه سازماندهی شدند.
با این حال، ایجاد یک کسب و کار بر روی منبع باز کار ساده ای نیست، زیرا شما بخش قابل توجهی از محصول خود را به صورت رایگان ارائه می کنید. راه حل شناسایی ویژگی هایی بود که شرکت ها برای آنها ارزش قائل بودند – ویژگی هایی مانند LDAP و ادغام Kerberos، که برای اکوسیستم های سازمانی حیاتی هستند اما برای توسعه دهندگان مستقل یا استارت آپ ها کمتر مرتبط هستند. این تقسیم بندی به ما این امکان را می دهد که بین کاربرانی که زمان بیشتری نسبت به پول دارند و افرادی که پول بیشتری نسبت به زمان دارند تمایز قائل شویم. اولی شامل دانشجویان و توسعه دهندگان مستقل است که محصول برای آنها رایگان است. دومی – شرکت های بزرگ – مایلند برای ویژگی هایی که توسعه کسب و کار اصلی آنها را سرعت می بخشد، هزینه بپردازند.
فلسفه کلیدی ساختن یک اکوسیستم پر رونق با ارائه رایگان محصول به کسانی است که زمان بیشتری نسبت به پول دارند و در عین حال از ویژگی های مورد نیاز شرکت ها کسب درآمد می کنند.
چگونه رشد جامعه محور را با توسعه تجارت متعادل کردید؟
ما در مورد این تعادل بسیار متفکر و عمدی بودیم. وقتی در اکوسیستم منبع باز بزرگ شدم، تجربه فکر کردن به کسب درآمد از نرم افزار منبع باز را داشتم. این یک فرآیند دو مرحلهای است: اول، دستیابی به تناسب محصول با بازار برای نسخه رایگان با اثبات ارزش اصلی پایگاههای داده گراف. دوم، دستیابی به تناسب محصول با بازار برای کسب درآمد با شناسایی ویژگیهای ارزشمند برای شرکتها. این استراتژی به ما این امکان را میدهد که پایگاه کاربران را به افرادی که میتوانیم کسب درآمد کنیم و کسانی که به رشد جامعه کمک میکنند، تفکیک کنیم.
پایگاه کاربر خود را امروز چگونه می بینید؟
پایگاه کاربران ما در دو محور تقسیم می شود: استارتاپ ها در مقابل شرکت ها و توسعه دهندگان در مقابل دانشمندان داده. برای استارتآپها، ما از پذیرش به جای کسب درآمد حمایت میکنیم. ما یک برنامه راه اندازی و یک سطح رایگان در ارائه ابر خود داریم، هاله، که یک گزینه سطح ورودی را با حداقل 65 دلار در ماه ارائه می دهد.
برای شرکت ها – در درجه اول جهانی 2000 – تمرکز ما بر کسب درآمد است. این سازمان ها برای ویژگی هایی ارزش قائل هستند که با اکوسیستم ها و زیرساخت های پیچیده آنها یکپارچه می شوند.
از نظر جمعیت شناسی کاربر، تقریباً 50-60٪ توسعه دهندگان و صاحبان برنامه ها و 40-50٪ دانشمندان داده هستند.
برای بنیانگذاران استارتآپ که شبکههای اجتماعی میسازند، پایگاههای اطلاعاتی گراف چگونه با پایگاههای داده رابطهای مقایسه میشوند؟
یک مدل گراف ذاتاً برای برنامههایی مانند شبکههای اجتماعی مناسبتر است، زیرا توانایی آن در مدیریت کارآمد دادههای متصل است. برخلاف پایگاههای داده رابطهای، که میتوانند با پرس و جوها و روابط پیچیده دست و پنجه نرم کنند، پایگاههای داده گراف در مدلسازی و پرسوجو روابط عالی هستند. این باعث می شود آنها برای برنامه هایی مانند شبکه های اجتماعی، موتورهای توصیه و تشخیص تقلب مناسب باشند.
با این حال، بسیاری از استارت آپ ها به دلیل آشنایی و تخصص موجود، با پایگاه داده های رابطه ای شروع می کنند. اغلب، زمانی که نیازهایشان پیچیدهتر میشود، به پایگاههای داده گراف منتقل میشوند، بهویژه زمانی که محدودیتهای مدلهای رابطهای در مدیریت دادههای متصل را برطرف میکنند.
برای بنیانگذاران جدید، اتخاذ یک مدل پایگاه داده گراف در مراحل اولیه می تواند باعث صرفه جویی در تلاش مهندسی مجدد شود، مشروط بر اینکه آنها مایل به سرمایه گذاری در کسب مهارت های لازم باشند. به عنوان مثال، Neo4j منابع کافی و پشتیبانی جامعه را برای کمک به تیمها در یادگیری و پیادهسازی پایگاههای داده گراف فراهم میکند.
چرا استارت آپ ها باید پایگاه داده های نموداری را به جای پایگاه های رابطه ای برای برنامه هایی مانند شبکه های اجتماعی انتخاب کنند؟
دو آرگومان اصلی با یک امتیاز وجود دارد:
1. سهولت توسعه:
پایگاه داده های گراف به طور طبیعی به دامنه های مربوط به اتصالات و روابط نگاشت می شوند. در یک شبکه اجتماعی، گرهها کاربران را نشان میدهند و روابط تعاملاتی مانند دوستی یا دنبال کردن را به تصویر میکشند. در حالی که پایگاههای اطلاعاتی رابطهای میتوانند چنین دادههایی را مدیریت کنند، نیاز به اتصالات متعدد بین جداول و ترجمههای پیچیده دارند که زمان توسعه قابل توجهی را اضافه میکند. برای استارتآپها، که سرعت ورود به بازار بسیار مهم است، پایگاههای داده گراف امکان تکرار و توسعه سریعتر را میدهند.
2. بینش پیشرفته:
پایگاه داده های گراف الگوریتم های بومی قدرتمندی را ارائه می دهند، مانند PageRank برای یافتن کاربران تاثیرگذار یا خوشه بندی Louvain برای شناسایی جوامع، که دستیابی به آنها در پایگاه داده های رابطه ای دشوار یا غیرممکن است. این قابلیت ها بینش هایی را امکان پذیر می کند که به طور مستقیم تعامل کاربر و عملکرد برنامه را افزایش می دهد.
3. تصحیح آینده با هوش مصنوعی (پاداش):
ابزارهای گراف مدرن با فناوری های هوش مصنوعی ادغام می شوند. به عنوان مثال، ادغام Neo4j با مدلهای زبان بزرگ (LLM) به شما امکان میدهد سوالاتی را به زبان طبیعی بپرسید، مانند: «بهترین تطابق بین مؤسس و سرمایهگذار چه کسی است؟» این سیستم پرس و جوهای گراف را تولید می کند و این فناوری را حتی برای کسانی که تخصص گسترده ای در گراف ندارند قابل دسترس می کند.
چشم انداز فعلی برای ادغام Neo4j با چارچوب های مدرن چگونه است؟
Neo4j، منبع باز و به طور گسترده پذیرفته شده است، با اکثر زبان ها و فریم ورک های برنامه نویسی ادغام می شود. به لطف جامعه توسعه دهندگان بزرگ، ادغام های بالغ برای پشته های محبوب مانند جنگو، روبی روی ریل و دیگران وجود دارد. بلوغ ادغامهای خاص به محبوبیت فریمورک بستگی دارد – فریمورکهای پر استفاده معمولاً رابطهای توسعهیافتهتری دارند. علاوه بر این، Neo4j از تمام ارائه دهندگان ابر اصلی، از جمله Google Cloud، AWS و Azure پشتیبانی می کند.
همانطور که پایگاه داده های گراف به تکامل خود ادامه می دهند، استانداردها نیز در حال ظهور هستند. Neo4j به طور فعال در شکل دادن به آینده زبان های پرس و جو گراف، مانند کار مداوم بر روی استاندارد بین المللی GQL برای زبان های پرس و جو گراف
آیا انتظار دارید پایگاه داده های گراف از پایگاه داده های رابطه ای پیشی بگیرند؟
پایگاه داده های رابطه ای سنگ بنای زیرساخت داده باقی خواهند ماند، به ویژه برای داده های جدولی و ساختار یافته مانند سیستم های حقوق و دستمزد یا برنامه های کاربردی ساده CRUD. با این حال، دامنههای مدرن شامل دادههای متصل – مانند توصیههای تجارت الکترونیک، شبکههای اجتماعی و کشف تقلب- بهتر توسط پایگاههای داده گراف ارائه میشوند. اکثر برنامههای کاربردی جدید احتمالاً پایگاههای اطلاعاتی نموداری را به کار میگیرند، زیرا ماهیت مرتبط دادههای امروزی را منعکس میکنند و قابلیتهای تحلیلی منحصربهفردی را ارائه میکنند.
پایگاه داده های گراف چه نقشی در هوش مصنوعی، به ویژه با Gen AI دارند؟
کاربرد قاتل هوش مصنوعی مولد در شرکت ها به مدل های زبان بزرگ (LLM) دسترسی به داده های داخلی سازمانی می دهد. این طی مراحلی تکامل یافته است:
1. تنظیم دقیق (اوایل 2023):
در ابتدا، تنظیم دقیق راه حل بود، اما نیاز به تخصص تخصصی، بازآموزی مداوم با تغییر داده ها، و فاقد کنترل های دسترسی دقیق داشت.
2. معماری RAG (اواسط تا اواخر 2023):
Retrieval-Augmented Generation (RAG) به عنوان یک رویکرد بهتر ظاهر شد. RAG LLM های خارج از قفسه را با بازیابی داده ها از پایگاه داده (مانند Neo4j) ترکیب می کند. این به LLM اجازه می دهد تا با استفاده از داده های سازمانی امن به روز و بدون آموزش مجدد، بینش ایجاد کند.
پایگاه داده های گراف، مانند Neo4j، در این زمینه حیاتی هستند RAG (همچنین به عنوان GraphRAG) زیرا نمودارهای دانش ساخته شده بر روی آنها در مدیریت روابط و پرس و جوهای غنی از زمینه، که برای کارهایی مانند درک نحوه اتصال نقاط داده داخلی به یکدیگر ضروری هستند، برتری دارند. همچنین ثابت شده است که آنها نتایج GenAI را دقیق، شفاف و قابل توضیح برای انسان های عادی می کنند. این مزایا بسیار زیاد است و چرا نمودار امروزه بخشی ضروری از پشته داده است.
Neo4j چگونه با چالش های هوش مصنوعی مقابله می کند؟
Neo4j عمیقاً با جریان های کاری هوش مصنوعی ادغام می شود. برای مثال، کاربران میتوانند درخواستهای زبان طبیعی را در مورد کسبوکار خود وارد کنند و سیستم از LLM برای ایجاد پرسوجوهای پیچیده Cypher استفاده میکند. این مانع پذیرش برای کاربران غیر فنی را کاهش می دهد و پایگاه داده های نمودار را با آینده برنامه های کاربردی سازمانی مبتنی بر هوش مصنوعی هماهنگ می کند.
نکات مهم از مکالمه
این مصاحبه چندین بینش کلیدی را برجسته کرد:
1. منبع باز به عنوان یک مدل کسب و کار:
Emil Eifrem دیدگاه قانعکنندهای در مورد نحوه استفاده Neo4j از منبع باز برای تقویت تعامل جامعه و در عین حال کسب درآمد استراتژیک از ویژگیهای خاص سازمانی ارائه کرد.
2. پایگاه های داده نمودار و یکپارچه سازی هوش مصنوعی:
مدل نمودار Neo4j به طور طبیعی با ساختار به هم پیوسته دادههای دنیای واقعی همسو میشود و آن را به یک انتخاب برتر برای برنامههای کاربردی با استفاده از شبکههای اجتماعی و موارد استفاده از هوش مصنوعی تبدیل میکند. ادغام پایگاههای داده گراف با فناوریهای هوش مصنوعی، بهویژه Retrieval-Augmented Generation (RAG) با GraphRAG، نشان میدهد که چگونه Neo4j شرکتها را قادر میسازد تا بینشها را استخراج کرده و نتایج قابل توضیح و ایمن ارائه دهند.
3. مطالعه موردی Klarna:
چت ربات هوش مصنوعی Klarna که توسط Neo4j طراحی شده است، به عنوان نمونه بارز هوش مصنوعی ROI در دنیای واقعی عمل می کند. را “کیکی” چت بات، ادغام شده با نمودار دانش Klarna، روش همکاری شرکت و بهبود بهره وری را تغییر می دهد. همانطور که Sebastian Siemiatkowski، یکی از بنیانگذاران و مدیر عامل Klarna، توضیح می دهد:
در Klarna، ما در حال تغییر نحوه همکاری با ربات چت GenAI Kiki خود هستیم که توسط نمودار دانش Neo4j طراحی شده است. Kiki اطلاعات را در چندین سیستم مختلف و متفاوت گرد هم میآورد، کیفیت آن اطلاعات را بهبود میبخشد و آنها را کاوش میکند، و تیمهای ما را قادر میسازد از Kiki هر چیزی از نیازهای منابع گرفته تا فرآیندهای داخلی و نحوه کار تیمها را بپرسند. این تاثیر بسیار زیادی بر بهرهوری دارد، به گونهای که پیش از این بدون نمودار و Neo4j قابل تصور نبود.»
این مطالعه موردی مزایای فناوری نمودار را در ایجاد تأثیر تجاری نشان میدهد و چگونگی مقیاسپذیری Neo4j را به عنوان یک شرکت برجسته میکند. در سال 2024، Neo4j به یک نقطه عطف درآمد قابل توجه، منعکس کننده تقاضای رو به رشد برای راه حل های پایگاه داده گراف آن در سراسر صنایع است.
4. بینش فرهنگی و منطقه ای:
امیل بر تسلط مستمر سیلیکون ولی به عنوان یک مرکز نوآوری، به ویژه در فضای هوش مصنوعی تأکید کرد، در حالی که اکوسیستم های نوظهور در شهرهایی مانند پاریس و مناطق پیشرو فناوری در آسیا را تصدیق کرد. دیدگاه او در مورد اخلاق کاری فرهنگی و تفاوت های نظارتی بین اروپا و ایالات متحده، دیدگاه متفاوتی از چالش ها و فرصت ها برای کارآفرینان در مناطق مختلف ارائه می دهد.
5. مشاوره عملی برای بنیانگذاران:
امیل به بنیانگذاران در مراحل اولیه توصیه کرد که خود را در سیلیکون ولی به دلیل مزایای اکوسیستم آن غوطه ور کنند و در عین حال تیم های مهندسی را فراتر از دره برای جذب و حفظ استعدادها گسترش دهند. بینش او منعکس کننده یک رویکرد متعادل برای استفاده از بهترین های هر دو جهان است.