امیل ایفرم، موسس و مدیر عامل Neo4j – چالش‌ها در توسعه Neo4j، بازاریابی مبتنی بر جامعه، پایگاه‌های داده نمودار برای کسب‌وکارها، یکپارچه‌سازی هوش مصنوعی، مطالعه موردی Klarna و توصیه‌های بنیانگذاران استارت‌آپ – AI Time Journal


در کنفرانس Slush 2024، امیل ایفرم، بنیانگذار و مدیر عامل شرکت Neo4j، به اشتراک گذاشت که چگونه پایگاه داده های گراف انقلابی در تجزیه و تحلیل داده ها ایجاد می کنند. Neo4j، که مقر آن در دره سیلیکون است، به موارد استفاده حیاتی از تحقیقات اسناد پاناما در مورد فرار مالیاتی تا مأموریت ناسا به مریخ و پذیرش شرکتی از هوش مصنوعی مولد قدرت می‌دهد. Neo4j که به دلیل پایگاه داده نموداری و فناوری تجزیه و تحلیل خود برای کشف روابط در داده ها شناخته شده است، برای چالش های پیچیده مبتنی بر داده های مرتبط با برنامه های مدرن مانند کشف تقلب، زنجیره تامین و هوش مصنوعی مولد ضروری شده است، با پیش بینی گارتنر پذیرش گسترده تا سال 2025. در این مصاحبه. ، امیل در مورد منشاء منبع باز Neo4j، ادغام هوش مصنوعی و مشاوره برای مدیران عامل شرکت ها و استارت آپ ها صحبت می کند. بنیانگذاران، بینش های ارزشمندی را در مورد آینده نوآوری مبتنی بر داده ارائه می دهند.

در روزهای اولیه Neo4j چه چالش هایی وجود داشت که به فرصت هایی برای توسعه محصول و استراتژی های عرضه به بازار تبدیل شد؟

یکی از بزرگ‌ترین فرصت‌ها و چالش‌ها در روزهای اولیه این بود که چگونه یک شرکت را بر اساس یک محصول منبع باز ایجاد کنیم. ما از ابتدا نسخه جامعه Neo4j را داشتیم که رایگان و متن باز بود. هر کسی می‌تواند آن را دانلود کند، با آن آزمایش کند، و برنامه‌های کاربردی بسازد – حتی بدون نیاز به ثبت نام. این دسترسی یک جنبش مردمی ایجاد کرد. به عنوان مثال، در سال 2019، 500 رویداد مستقل مرتبط با Neo4j، مانند جلسات و وبینارها، برگزار شد که بیشتر آنها به صورت خودجوش توسط جامعه سازماندهی شدند.

با این حال، ایجاد یک کسب و کار بر روی منبع باز کار ساده ای نیست، زیرا شما بخش قابل توجهی از محصول خود را به صورت رایگان ارائه می کنید. راه حل شناسایی ویژگی هایی بود که شرکت ها برای آنها ارزش قائل بودند – ویژگی هایی مانند LDAP و ادغام Kerberos، که برای اکوسیستم های سازمانی حیاتی هستند اما برای توسعه دهندگان مستقل یا استارت آپ ها کمتر مرتبط هستند. این تقسیم بندی به ما این امکان را می دهد که بین کاربرانی که زمان بیشتری نسبت به پول دارند و افرادی که پول بیشتری نسبت به زمان دارند تمایز قائل شویم. اولی شامل دانشجویان و توسعه دهندگان مستقل است که محصول برای آنها رایگان است. دومی – شرکت های بزرگ – مایلند برای ویژگی هایی که توسعه کسب و کار اصلی آنها را سرعت می بخشد، هزینه بپردازند.

فلسفه کلیدی ساختن یک اکوسیستم پر رونق با ارائه رایگان محصول به کسانی است که زمان بیشتری نسبت به پول دارند و در عین حال از ویژگی های مورد نیاز شرکت ها کسب درآمد می کنند.

چگونه رشد جامعه محور را با توسعه تجارت متعادل کردید؟

ما در مورد این تعادل بسیار متفکر و عمدی بودیم. وقتی در اکوسیستم منبع باز بزرگ شدم، تجربه فکر کردن به کسب درآمد از نرم افزار منبع باز را داشتم. این یک فرآیند دو مرحله‌ای است: اول، دستیابی به تناسب محصول با بازار برای نسخه رایگان با اثبات ارزش اصلی پایگاه‌های داده گراف. دوم، دستیابی به تناسب محصول با بازار برای کسب درآمد با شناسایی ویژگی‌های ارزشمند برای شرکت‌ها. این استراتژی به ما این امکان را می‌دهد که پایگاه کاربران را به افرادی که می‌توانیم کسب درآمد کنیم و کسانی که به رشد جامعه کمک می‌کنند، تفکیک کنیم.

پایگاه کاربر خود را امروز چگونه می بینید؟

پایگاه کاربران ما در دو محور تقسیم می شود: استارتاپ ها در مقابل شرکت ها و توسعه دهندگان در مقابل دانشمندان داده. برای استارت‌آپ‌ها، ما از پذیرش به جای کسب درآمد حمایت می‌کنیم. ما یک برنامه راه اندازی و یک سطح رایگان در ارائه ابر خود داریم، هاله، که یک گزینه سطح ورودی را با حداقل 65 دلار در ماه ارائه می دهد.

برای شرکت ها – در درجه اول جهانی 2000 – تمرکز ما بر کسب درآمد است. این سازمان ها برای ویژگی هایی ارزش قائل هستند که با اکوسیستم ها و زیرساخت های پیچیده آنها یکپارچه می شوند.

از نظر جمعیت شناسی کاربر، تقریباً 50-60٪ توسعه دهندگان و صاحبان برنامه ها و 40-50٪ دانشمندان داده هستند.

برای بنیان‌گذاران استارت‌آپ که شبکه‌های اجتماعی می‌سازند، پایگاه‌های اطلاعاتی گراف چگونه با پایگاه‌های داده رابطه‌ای مقایسه می‌شوند؟

یک مدل گراف ذاتاً برای برنامه‌هایی مانند شبکه‌های اجتماعی مناسب‌تر است، زیرا توانایی آن در مدیریت کارآمد داده‌های متصل است. برخلاف پایگاه‌های داده رابطه‌ای، که می‌توانند با پرس و جوها و روابط پیچیده دست و پنجه نرم کنند، پایگاه‌های داده گراف در مدل‌سازی و پرس‌وجو روابط عالی هستند. این باعث می شود آنها برای برنامه هایی مانند شبکه های اجتماعی، موتورهای توصیه و تشخیص تقلب مناسب باشند.

با این حال، بسیاری از استارت آپ ها به دلیل آشنایی و تخصص موجود، با پایگاه داده های رابطه ای شروع می کنند. اغلب، زمانی که نیازهایشان پیچیده‌تر می‌شود، به پایگاه‌های داده گراف منتقل می‌شوند، به‌ویژه زمانی که محدودیت‌های مدل‌های رابطه‌ای در مدیریت داده‌های متصل را برطرف می‌کنند.

برای بنیانگذاران جدید، اتخاذ یک مدل پایگاه داده گراف در مراحل اولیه می تواند باعث صرفه جویی در تلاش مهندسی مجدد شود، مشروط بر اینکه آنها مایل به سرمایه گذاری در کسب مهارت های لازم باشند. به عنوان مثال، Neo4j منابع کافی و پشتیبانی جامعه را برای کمک به تیم‌ها در یادگیری و پیاده‌سازی پایگاه‌های داده گراف فراهم می‌کند.

چرا استارت آپ ها باید پایگاه داده های نموداری را به جای پایگاه های رابطه ای برای برنامه هایی مانند شبکه های اجتماعی انتخاب کنند؟

دو آرگومان اصلی با یک امتیاز وجود دارد:

1. سهولت توسعه:
پایگاه داده های گراف به طور طبیعی به دامنه های مربوط به اتصالات و روابط نگاشت می شوند. در یک شبکه اجتماعی، گره‌ها کاربران را نشان می‌دهند و روابط تعاملاتی مانند دوستی یا دنبال کردن را به تصویر می‌کشند. در حالی که پایگاه‌های اطلاعاتی رابطه‌ای می‌توانند چنین داده‌هایی را مدیریت کنند، نیاز به اتصالات متعدد بین جداول و ترجمه‌های پیچیده دارند که زمان توسعه قابل توجهی را اضافه می‌کند. برای استارت‌آپ‌ها، که سرعت ورود به بازار بسیار مهم است، پایگاه‌های داده گراف امکان تکرار و توسعه سریع‌تر را می‌دهند.

2. بینش پیشرفته:
پایگاه داده های گراف الگوریتم های بومی قدرتمندی را ارائه می دهند، مانند PageRank برای یافتن کاربران تاثیرگذار یا خوشه بندی Louvain برای شناسایی جوامع، که دستیابی به آنها در پایگاه داده های رابطه ای دشوار یا غیرممکن است. این قابلیت ها بینش هایی را امکان پذیر می کند که به طور مستقیم تعامل کاربر و عملکرد برنامه را افزایش می دهد.

3. تصحیح آینده با هوش مصنوعی (پاداش):
ابزارهای گراف مدرن با فناوری های هوش مصنوعی ادغام می شوند. به عنوان مثال، ادغام Neo4j با مدل‌های زبان بزرگ (LLM) به شما امکان می‌دهد سوالاتی را به زبان طبیعی بپرسید، مانند: «بهترین تطابق بین مؤسس و سرمایه‌گذار چه کسی است؟» این سیستم پرس و جوهای گراف را تولید می کند و این فناوری را حتی برای کسانی که تخصص گسترده ای در گراف ندارند قابل دسترس می کند.

چشم انداز فعلی برای ادغام Neo4j با چارچوب های مدرن چگونه است؟

Neo4j، منبع باز و به طور گسترده پذیرفته شده است، با اکثر زبان ها و فریم ورک های برنامه نویسی ادغام می شود. به لطف جامعه توسعه دهندگان بزرگ، ادغام های بالغ برای پشته های محبوب مانند جنگو، روبی روی ریل و دیگران وجود دارد. بلوغ ادغام‌های خاص به محبوبیت فریم‌ورک بستگی دارد – فریم‌ورک‌های پر استفاده معمولاً رابط‌های توسعه‌یافته‌تری دارند. علاوه بر این، Neo4j از تمام ارائه دهندگان ابر اصلی، از جمله Google Cloud، AWS و Azure پشتیبانی می کند.

همانطور که پایگاه داده های گراف به تکامل خود ادامه می دهند، استانداردها نیز در حال ظهور هستند. Neo4j به طور فعال در شکل دادن به آینده زبان های پرس و جو گراف، مانند کار مداوم بر روی استاندارد بین المللی GQL برای زبان های پرس و جو گراف

آیا انتظار دارید پایگاه داده های گراف از پایگاه داده های رابطه ای پیشی بگیرند؟

پایگاه داده های رابطه ای سنگ بنای زیرساخت داده باقی خواهند ماند، به ویژه برای داده های جدولی و ساختار یافته مانند سیستم های حقوق و دستمزد یا برنامه های کاربردی ساده CRUD. با این حال، دامنه‌های مدرن شامل داده‌های متصل – مانند توصیه‌های تجارت الکترونیک، شبکه‌های اجتماعی و کشف تقلب- بهتر توسط پایگاه‌های داده گراف ارائه می‌شوند. اکثر برنامه‌های کاربردی جدید احتمالاً پایگاه‌های اطلاعاتی نموداری را به کار می‌گیرند، زیرا ماهیت مرتبط داده‌های امروزی را منعکس می‌کنند و قابلیت‌های تحلیلی منحصربه‌فردی را ارائه می‌کنند.

پایگاه داده های گراف چه نقشی در هوش مصنوعی، به ویژه با Gen AI دارند؟

کاربرد قاتل هوش مصنوعی مولد در شرکت ها به مدل های زبان بزرگ (LLM) دسترسی به داده های داخلی سازمانی می دهد. این طی مراحلی تکامل یافته است:

1. تنظیم دقیق (اوایل 2023):
در ابتدا، تنظیم دقیق راه حل بود، اما نیاز به تخصص تخصصی، بازآموزی مداوم با تغییر داده ها، و فاقد کنترل های دسترسی دقیق داشت.

2. معماری RAG (اواسط تا اواخر 2023):
Retrieval-Augmented Generation (RAG) به عنوان یک رویکرد بهتر ظاهر شد. RAG LLM های خارج از قفسه را با بازیابی داده ها از پایگاه داده (مانند Neo4j) ترکیب می کند. این به LLM اجازه می دهد تا با استفاده از داده های سازمانی امن به روز و بدون آموزش مجدد، بینش ایجاد کند.

پایگاه داده های گراف، مانند Neo4j، در این زمینه حیاتی هستند RAG (همچنین به عنوان GraphRAG) زیرا نمودارهای دانش ساخته شده بر روی آنها در مدیریت روابط و پرس و جوهای غنی از زمینه، که برای کارهایی مانند درک نحوه اتصال نقاط داده داخلی به یکدیگر ضروری هستند، برتری دارند. همچنین ثابت شده است که آنها نتایج GenAI را دقیق، شفاف و قابل توضیح برای انسان های عادی می کنند. این مزایا بسیار زیاد است و چرا نمودار امروزه بخشی ضروری از پشته داده است.

Neo4j چگونه با چالش های هوش مصنوعی مقابله می کند؟

Neo4j عمیقاً با جریان های کاری هوش مصنوعی ادغام می شود. برای مثال، کاربران می‌توانند درخواست‌های زبان طبیعی را در مورد کسب‌وکار خود وارد کنند و سیستم از LLM برای ایجاد پرس‌وجوهای پیچیده Cypher استفاده می‌کند. این مانع پذیرش برای کاربران غیر فنی را کاهش می دهد و پایگاه داده های نمودار را با آینده برنامه های کاربردی سازمانی مبتنی بر هوش مصنوعی هماهنگ می کند.

نکات مهم از مکالمه

این مصاحبه چندین بینش کلیدی را برجسته کرد:

1. منبع باز به عنوان یک مدل کسب و کار:
Emil Eifrem دیدگاه قانع‌کننده‌ای در مورد نحوه استفاده Neo4j از منبع باز برای تقویت تعامل جامعه و در عین حال کسب درآمد استراتژیک از ویژگی‌های خاص سازمانی ارائه کرد.

2. پایگاه های داده نمودار و یکپارچه سازی هوش مصنوعی:
مدل نمودار Neo4j به طور طبیعی با ساختار به هم پیوسته داده‌های دنیای واقعی همسو می‌شود و آن را به یک انتخاب برتر برای برنامه‌های کاربردی با استفاده از شبکه‌های اجتماعی و موارد استفاده از هوش مصنوعی تبدیل می‌کند. ادغام پایگاه‌های داده گراف با فناوری‌های هوش مصنوعی، به‌ویژه Retrieval-Augmented Generation (RAG) با GraphRAG، نشان می‌دهد که چگونه Neo4j شرکت‌ها را قادر می‌سازد تا بینش‌ها را استخراج کرده و نتایج قابل توضیح و ایمن ارائه دهند.

3. مطالعه موردی Klarna:
چت ربات هوش مصنوعی Klarna که توسط Neo4j طراحی شده است، به عنوان نمونه بارز هوش مصنوعی ROI در دنیای واقعی عمل می کند. را “کیکی” چت بات، ادغام شده با نمودار دانش Klarna، روش همکاری شرکت و بهبود بهره وری را تغییر می دهد. همانطور که Sebastian Siemiatkowski، یکی از بنیانگذاران و مدیر عامل Klarna، توضیح می دهد:

در Klarna، ما در حال تغییر نحوه همکاری با ربات چت GenAI Kiki خود هستیم که توسط نمودار دانش Neo4j طراحی شده است. Kiki اطلاعات را در چندین سیستم مختلف و متفاوت گرد هم می‌آورد، کیفیت آن اطلاعات را بهبود می‌بخشد و آن‌ها را کاوش می‌کند، و تیم‌های ما را قادر می‌سازد از Kiki هر چیزی از نیازهای منابع گرفته تا فرآیندهای داخلی و نحوه کار تیم‌ها را بپرسند. این تاثیر بسیار زیادی بر بهره‌وری دارد، به گونه‌ای که پیش از این بدون نمودار و Neo4j قابل تصور نبود.»

این مطالعه موردی مزایای فناوری نمودار را در ایجاد تأثیر تجاری نشان می‌دهد و چگونگی مقیاس‌پذیری Neo4j را به عنوان یک شرکت برجسته می‌کند. در سال 2024، Neo4j به یک نقطه عطف درآمد قابل توجه، منعکس کننده تقاضای رو به رشد برای راه حل های پایگاه داده گراف آن در سراسر صنایع است.

4. بینش فرهنگی و منطقه ای:
امیل بر تسلط مستمر سیلیکون ولی به عنوان یک مرکز نوآوری، به ویژه در فضای هوش مصنوعی تأکید کرد، در حالی که اکوسیستم های نوظهور در شهرهایی مانند پاریس و مناطق پیشرو فناوری در آسیا را تصدیق کرد. دیدگاه او در مورد اخلاق کاری فرهنگی و تفاوت های نظارتی بین اروپا و ایالات متحده، دیدگاه متفاوتی از چالش ها و فرصت ها برای کارآفرینان در مناطق مختلف ارائه می دهد.

5. مشاوره عملی برای بنیانگذاران:
امیل به بنیانگذاران در مراحل اولیه توصیه کرد که خود را در سیلیکون ولی به دلیل مزایای اکوسیستم آن غوطه ور کنند و در عین حال تیم های مهندسی را فراتر از دره برای جذب و حفظ استعدادها گسترش دهند. بینش او منعکس کننده یک رویکرد متعادل برای استفاده از بهترین های هر دو جهان است.




منبع: https://www.aitimejournal.com/emil-eifrem-founder-and-ceo-of-neo4j-challenges-in-neo4j-development-community-driven-marketing-graph-databases-for-businesses-ai-integration-klarna-case-study-and-startup-founders-a/50777/