المدونات
في الإصدار v.step 3.0.step 1، لا يزال Sphinx يتطلب سمة idattribute إضافية، ويمكنك ضمنيًا إدخال سطر id BIGINT في الفهارس (كما لاحظت على الأرجح في قسم "البدء" الأخير). أخيرًا وليس آخرًا، هناك أنواع قوائم متعددة ذكرتها أدناه. للحصول على "أعمدة" تعرف نوعها مسبقًا، يمكنك استخدام الخصائص المكتوبة بشكل ثابت، والاستفادة من الكفاءة المطلقة الجديدة.
تتيح لك خاصية تنسيق النصاب إجراء مطابقة تقريبية. وهي أقل صرامة من مجرد تنسيق كلمات الوسيط. مع ذلك، فإن مستندًا رائعًا مثل "واحد اثنان aaa bbb ccc ddd حوالي ثلاثة" لا يتطابق مع أحدث الكلمات المفتاحية القريبة (NEARs)، لأن الفجوة بين اثنين وثلاثة كبيرة جدًا. ويمكنك أن تتخيل العكس، ماذا لو وصلنا إلى الحد الأقصى للتقارب لمطابقة الحد الأقصى المسموح به بسبب جميع الكلمات المفتاحية القريبة؟ يقوم وكيل المسافة بمطابقة جميع الكلمات المفتاحية المحددة، بأي ترتيب تقريبًا، وسيسمح بوجود العديد من الفجوات بين هذه الكلمات.
بما أن عناكب المتجهات المناسبة لا تُنشأ بسرعة، وقد يبدو أن مناطق ذاكرة الوصول free spins bonus العشوائي (RAM) تُحوّل بشكل غير متوقع، فإن عناكب SQ تخدم متجهات الانحراف فقط، لأن تكميم متجهات INT8 ينتج عنه قيمة أقل من الصفر. فهارس SQ مستقلة عن المقياس، ويمكنها تسريع استعلامات DOT() و L1DIST(). عادةً ما تكون منشورات Vecindex_posts التي تحتوي على فهارس HNSWindexes أعلى من تلك التي تحتوي على عناكب FAISS IVFPQ.

يتم حساب قيم IDF للعلامات تلقائيًا (أ) لكل جزء، ويمكنك (ب) حسابها عبر الإنترنت. وهذا يسمح لنا بترتيب تسلسلات الكلمات النادرة والمهمة أعلى من تسلسلات الكلمات المتكررة، حتى لو كان الجزء الأخير مطولًا. باختصار، تحصل الكلمات المتكررة (غير المهمة) على قيم IDF منخفضة، وتظهر بقيمة صفر كحد أدنى إذا كانت الكلمة موجودة في جميع ملفات البيانات المدرجة.
لدعم ذلك، بما في ذلك الخطوة 3.5، يمكنك تحديد مصطلحين بشكل صريح لوضعهما عبر وسيطة كتابية في دالة FACTORS(). مع ذلك، قد يتطلب الأمر تنسيقًا، وقد تختلف المواضع. تُحدد مؤشرات مواضع النصوص باستخدام الكلمات المطلوبة في دالة Matches(). ولكن لأغراض الترتيب، سيتم تجاهل أي مواضع (نتائج) تتعلق بمناطق "النظام" وستكون غير مرئية.
السيناريو المستهدف هو في الواقع "الإعداد والنسيان"، أي أن برامج الزحف المكررة تحاول فهم الأعضاء. يعتمد زوار موقع النظام الجديد في هذه المزامنة "عبر الإنترنت" على سرعة كتابة البيانات، ويمكنك ترجمة ذلك إلى معدلات إنشاء سجل التغييرات الثنائية (المعروف أيضًا باسم سجل العمليات) على الجانب الرئيسي. عندما يتم (إعادة) إنشاء اتصال بالجانب الرئيسي، يجب على المحاكاة الجديدة أولاً مزامنة فحص الفهرس مع جانبك الرئيسي. تقوم الصور أساسًا بسحب الملفات المفقودة فقط. دعنا نخدعك لبعض الوقت. تقوم الفهارس المكررة بإزالة أحدث صورة من سجلك، ثم سحب حالة سجل العمليات.

بصورة أدق، تُعيد هذه الدالة متجهًا فرعيًا يبدأ عند الفهرس وينتهي قبل الفهرس مباشرةً في الوسيط. تُعيد الدالة VSLICE()