چگونه Embracing Data Fabric می تواند ارزش ابتکار هوش مصنوعی را افزایش دهد


رهبران داده و تجزیه و تحلیل برای کسب بیشترین ارزش تجاری از ابتکارات فناوری و هوش مصنوعی خود، از نزدیک با همتایان IT و CX خود همکاری می کنند تا استراتژی ها را برای نتایج بهینه هماهنگ کنند. در همین حال، بزرگترین دارایی آنها – داده های آنها – به طور فزاینده ای بدون ساختار است و به طور تصاعدی در حال رشد است.

با توجه به IDC80 درصد از داده های سازمانی تا سال 2025 بدون ساختار خواهند بود، اما بیشتر تصمیمات تجاری بر روی 20 درصد باقی مانده داده های ساختاریافته گرفته می شود. بسیاری از سازمان‌ها برای عملیاتی کردن و درک داده‌های قفل‌شده در قالب‌های بدون ساختار تلاش می‌کنند، بنابراین نقش مدیریت دانش سازمانی بسیار مهم می‌شود.

مدیریت داده ها پایه ای کلیدی برای یک استراتژی هوش مصنوعی موفق است. در این زمینه، چندین گرایش پیرامون الگوهای معماری داده مانند پارچه داده و مش داده در حال ظهور است. سازمان ها این رویکردها را برای ارضای نیاز به بینش تجاری و دستیابی به ساختاری بهینه شده برای امنیت و حاکمیت در پیش می گیرند. پارچه داده عمدتاً به دلیل انعطاف پذیری کافی برای انطباق با رشد داده های پیچیده و همچنین می تواند با نیازهای یک تجارت مقیاس شود، مورد توجه قرار گرفته است. رهبران داده باید این را پایه و اساس استراتژی داده خود قرار دهند تا از سرمایه گذاری های هوش مصنوعی خود نهایت استفاده را ببرند.

نیاز به زمینه داده

با ظهور هوش مصنوعی، از جمله LLM ها و برنامه های کاربردی تقویت شده با هوش مصنوعی، سیستم های مدیریت دانش برای تامین داده های مورد نیاز برای تغذیه هوش مصنوعی حیاتی هستند. آن دسته از رهبران فناوری و داده که سعی در استفاده معنادار از داده های خود دارند، می توانند دانش را به صورت غیررسمی به اشتراک بگذارند، اما این رویکرد به خوبی مقیاس نمی شود. رویکرد فراداده محور، از جمله مدیریت فراداده، هستی شناسی ها و نمودارهای دانش، با هدف رسمی کردن آن دانش است. متأسفانه، این نمایش‌ها اغلب با داده‌هایی که دانش را ایجاد می‌کنند قطع می‌شوند و اغلب منجر به استفاده محدود می‌شوند.

مرتبط:آینده کسب استعدادهای هوش مصنوعی در اروپا

رهبران کسب و کار امروزی آرزوی حل مشکلات پیچیده داده و دستیابی به چابکی داده را دارند. آنها می خواهند داده ها را به هم متصل کنند، ایجاد کنند، تفسیر کنند و مصرف کنند، اما نه به خودی خود – باید با هر چیزی که در مورد داده ها شناخته شده است مرتبط باشد. این زمینه را ضروری می کند. زمینه ای مانند اینکه اطلاعات از کجا می آید، چگونه استفاده می شود و چه کسی آن را مصرف می کند. در نتیجه، فراخوانی فزاینده ای برای تکامل معماری سازمانی برای ترکیب یک لایه معنایی وجود دارد تا بتوان داده های زنده را با سرعت تفسیر کرد. باید یکپارچه، کامل و دقیق باشد.

محدودیت های استراتژی های مدیریت داده های موجود

همین چند سال پیش، سازمان‌ها داده‌های مکان‌هایی مانند ERP یا سیستم‌های نیروی فروش خود را در یک مکان اختصاصی برای تجزیه و تحلیل کپی می‌کردند. سپس رویکردها به سمت استفاده از دریاچه های داده برای مهار داده های بدون ساختار حرکت کردند. اکنون که سازمان‌ها حتی سیستم‌های بیشتری برای یکپارچه‌سازی دارند، باید مطمئن شوند که داده‌ها دقیق هستند، زمانی که در بیش از یک مکان ذخیره می‌شوند تکراری نمی‌شوند و هیچ تناقضی وجود ندارد. در حالی که مزیت کلیدی انبار داده ارائه یک منبع داده واحد است، ساختار آن می تواند کاملاً محدود کننده باشد.

مرتبط:درک عمومی از هوش مصنوعی

هنگام وارد کردن سیستم‌های جدید از مکان‌های دیگر، انبار داده باید کاملاً به‌روز باشد، اما اجرای تغییرات ممکن است زمان زیادی را ببرد. این باعث می شود که انبار داده به راحتی قدیمی شود. مقدار فزاینده ای از داده ها روزانه با برخی از الزامات تجزیه و تحلیل مورد نیاز در زمان واقعی بارگذاری می شود. این بدان معناست که انبار داده یا دریاچه داده در حال جمع آوری اطلاعات از سیلوها است اما در اصل به عنوان سیلو دیگری عمل می کند.

Data Fabric چیست

ساختار داده یکی از راه های دسترسی به دانش سازمانی به شیوه ای قابل درک است. با استفاده از یک لایه معنایی، داده‌ها داده‌ها و ابرداده‌ها را در یک نمای یکپارچه می‌بافند که دارایی‌های اطلاعاتی را ترسیم می‌کند و دسترسی بر اساس تقاضا به دانش قابل استفاده مجدد را در سراسر سازمان امکان‌پذیر می‌سازد. این امر باعث ترویج همکاری بهتر، اتکای کمتر به تیم‌های فناوری اطلاعات برای عملیات داده‌ها و خودسرویس بیشتر برای تجزیه و تحلیل داده‌ها می‌شود.

لایه معنایی پیچیدگی را به حداقل می رساند و داده ها را از منابع بسیاری در یک کاتالوگ داده متحد می کند. در همین حال، طرحواره های داده به طور خودکار خوانده می شوند تا داده ها به روز نگه داشته شوند. این داده‌ها به‌عنوان یک نمودار دانش یا یک شبکه اطلاعاتی از حقایق مرتبط معنایی ارائه می‌شوند که برای کاربران داده بصری است و برای مدل‌های زبان بزرگ قابل خواندن است.

تفاوت بین Data Fabrics و Data Mesh

پارچه‌های داده و مش داده‌ها هدفی مشابه دارند: دسترسی آسان کاربران نهایی به اطلاعاتی که برای پشتیبانی از کار و تصمیم‌هایشان نیاز دارند. شبکه داده بر تولید محصولات داده خاص برای یک دامنه یا واحد تجاری متمرکز است که به افرادی که به بهترین وجه از داده ها می فهمند اجازه می دهد تا به طور مستقل آن را مدیریت و اداره کنند، مالکیت را توزیع کنند و پاسخگویی و شفافیت را در کسب و کار ارتقا دهند. با بافت های داده، حاکمیت بر مبنای مرکزی تری مدیریت می شود، که تفاوت اصلی بین این دو معماری است. واقعیت این است که هر دو رویکرد دارای جنبه‌های منفی هستند و اجرای نزدیک به تعریف دشوار است.

اکثر سازمان‌ها بسته به بلوغ ابرداده و خط‌مشی‌های حاکمیتی خود، از یک رویکرد ترکیبی و ترکیبی سود می‌برند. ضروری است که هدف تجاری از تکامل معماری سازمانی ایجاد یک نقطه مرکزی دسترسی را در نظر داشته باشید. در بسیاری از موارد، یک رویکرد ترکیبی بین یک مخزن داده متمرکز، یکپارچه سازی و امنیت همراه با حاکمیت فدرال بهترین کار را خواهد داشت.

گارتنر پیش‌بینی کرد که تا سال 2027، 30 درصد شرکت‌ها از اکوسیستم‌های داده تقویت‌شده با عناصر بافت داده‌ای که از معماری برنامه‌های ترکیبی پشتیبانی می‌کنند برای دستیابی به مزیت رقابتی قابل توجه استفاده خواهند کرد.

مزایای یک پلت فرم مدیریت داده متصل

با تکامل هوش مصنوعی، کارشناسان فناوری و تیم‌های تجاری همچنان در حال یادگیری مسائل و محدودیت‌های مرتبط هستند. در حالی که مدیریت داده های ساخت یافته، لازم برای تجزیه و تحلیل، برای دهه ها بر این حوزه تسلط داشت، هوش مصنوعی از فرمت های داده های بدون ساختار مانند اسناد، گزارش ها، ویدئو و موارد دیگر تغذیه می کند. این در حال حاضر سازمان ها را وادار می کند تا داده های کیفی را به عنوان یک رکن مرکزی در استراتژی های داده و هوش مصنوعی خود در اولویت قرار دهند. با این حال، تعداد کمی از پلتفرم‌ها می‌توانند با همه آن انواع داده کار کنند. آنها معمولاً آن را به شکلی که برای آنها مناسب است ماساژ می دهند – شاید در ردیف ها و ستون ها.

یک پلت فرم مدیریت داده اختصاصی و یکپارچه می تواند با داده های بومی همانطور که هست کار کند. می‌تواند آن را به‌عنوان داده‌های نمودار، ردیف‌ها، ستون‌ها و فهرست‌ها ذخیره کند، و می‌تواند یک مدل دانش، واژه‌نامه تجاری و ابرداده فعال ایجاد کند تا هوش مصنوعی را قادر سازد با همه آن نوع رکوردها کار کند.

سازمان‌های سازمانی می‌توانند با استفاده از یک پلتفرم منفرد مملو از قابلیت‌ها، نتایج را سریع‌تر با ریسک کمتر ارائه دهند. الف پلت فرم داده برای فعال کردن بافت داده عناصری را گرد هم می‌آورد که در غیر این صورت می‌توانند به بسیاری از فروشندگان و مؤلفه‌های منبع باز برای تکرار نیاز داشته باشند. سه مزیت کلیدی برای مدیران داده برای استفاده از پلتفرم مدیریت داده وجود دارد:

  • اتصال – همه داده‌ها و ابرداده‌های خود را در یک پلتفرم داده در سطح سازمانی یکپارچه کنید.

  • ایجاد – نمودار دانش سازمانی خود را مدل کنید و از هوش مصنوعی معنایی برای ایجاد ابرداده استفاده کنید.

  • مصرف – داده های یکپارچه و باکیفیت را در زمینه مورد استفاده و مخاطبان ارائه دهید.

چالش فعلی و دقیق نگه داشتن داده ها برای هوش مصنوعی

در حالی که هوش مصنوعی و یادگیری ماشین فرصت فوق‌العاده‌ای برای هر سازمانی ایجاد می‌کنند، بزرگترین سوال این است که چه چیزی LLM یا مدل‌های زبان کوچک را صادقانه نگه می‌دارد. پاسخ داده است.

یک چالش بزرگ با استقرار سازمانی پروژه های یادگیری ماشینی، نگه داشتن داده ها به روز و دقیق است. تیم‌ها باید پاسخ‌های توهمات را تأیید کنند، به‌ویژه در مورد ابزارهایی مانند ChatGPT، و نسب و قابلیت ردیابی آن پاسخ‌ها را ارائه کنند.

این امر مستلزم بازگرداندن برخی از عناصر پاسخ به داده هایی است که برای تصمیم گیری استفاده شده است. به این معنی که عناصر پاسخ‌ها را به داده‌های داخلی قابل اعتماد و دقیقی که مدیریت می‌شود، پیوند می‌دهد. فابریک داده فقط از یک پاسخ استاندارد استفاده نمی کند، بلکه از پاسخی بر اساس داده های سازمانی شما به علاوه معنایی استفاده می کند.

یک مورد استفاده خرده فروشی مانند قابلیت ردیابی محصول را در نظر بگیرید. ردیابی یک محصول خارج از قفسه به یک انبار توزیع، یک خط تولید یا یک تامین کننده مواد خام که شرکت سه ماه قبل آن را بررسی کرده بود و مشکل کنترل کیفیت با آن داشت، دشوار است. دیده شدن و شفافیت زنجیره تامین چیزی است که اهمیت فزاینده ای پیدا می کند. مدیریت دانش در هر مرحله از سفر بسیار مهم است.

تقویت پتانسیل هوش مصنوعی با یک سرویس داده سازمانی

تنها راه دستیابی به چابکی داده و به دست آوردن ارزش بهینه از فرصت های هوش مصنوعی، ادغام عمیق داده های فعال، ابرداده فعال و معنای فعال است. هرکسی که می‌خواهد آن برنامه‌ها را به هم متصل کند و ارزش داده‌ای را ارائه کند که منابع داده‌های متعددی را در بر می‌گیرد، باید بافت داده را در نظر بگیرد.

زمانی که تیم‌ها متوجه شوند که داده‌ها در برنامه‌هایی که استفاده می‌کنند قفل شده است، معماری‌ها همواره از برنامه محوری به داده محوری حرکت می‌کنند. یک پلت فرم واحد که معنی داده ها و ابرداده ها و حقایق موجود در آنها را در کنار هم نگه می دارد، مدیریت داده های سازمان را با تبدیل شدن به یک منبع قدرتمند مهار شده بهبود می بخشد.

با استفاده از این فناوری، CIOها و CDOها می‌توانند با مدیریت دانش مناسب، دنیای داده‌های خود را گسترش دهند و با داده‌های بیشتری تصمیم‌های تجاری مبتنی بر هوش مصنوعی بگیرند. خطوط لوله بلادرنگ به آن‌ها امکان می‌دهد داده‌ها را سریع‌تر دریافت، مدیریت و مصرف کنند و به چابکی داده دست یابند تا بتوانند به سرعت به تغییرات بچرخند و واکنش نشان دهند.





منبع: https://aibusiness.com/data/how-embracing-data-fabric-can-enhance-the-value-of-ai-initiative