نظرًا لأن عدد خيوط المعالجة محدود، فمن المرجح أن تُضاف الطلبات الواردة التي لا يملك المعالجون القدرة على معالجتها إلى قائمة الانتظار، وقد تضطر إلى انتظار خيط معالجة متاح. عندما تكون جميع استفساراتك تقريبًا صغيرة، فإن هذه الثواني القليلة (0.4 مللي ثانية) قد تكون مهمة. مع ذلك، كن على دراية بأن هذا قد يكون في حالة حرجة عندما يكون متوسط زمن الاستجابة لديك في حدود 1 مللي ثانية. هذا يساعد في حالة ضغط الاستفسارات الشديد لدرجة أن خيط المعالجة قد يُستنفد. عليك أن تقول "تقريبًا" فقط، فقد يكون هناك عدد أكبر من التطابقات في بعض الأحيان.
الأوضاع
يحتاج مُجزئ BPE الخاص بنا إلى ملف دمج BPE خارجي (توجيه bpe_merges_file). لإنشاء مُرشِّح Bloom جديد، سأقوم بتحديد رموز alt الخمسة الناتجة، وحذفها، وحساب قيم التجزئة، ووضع بضعة بتات لكل رمز في مُرشِّح Bloom ذي 128 جزءًا. للتذكير، يتم تحديد رموز alt على النص الخام تقريبًا، مع تطبيق charset_table فقط على حالات الطي. إذن، ما هي رموز trigram التي سيتم استخراجها (والتي يمكنك تخزينها في مُرشِّح Bloom)؟
بما في ذلك المحتوى
ملخص للصناعات التي يجب إنشاء تجزئات رموز داخلية لها، أثناء تاريخ الفهرسة. ملخص للمجالات التي يجب تحليلها لامتلاك فئات الرموز، ويمكنك تخزين نظارات الفئة المعنية لها، خلال وقت الفهرسة. مقالات Field_sequence هي في الأساس عمود واحد رائع لكل منها نص كامل ملحوظ، ويمكنك تخزينه في ذاكرة الوصول العشوائي (RAM). كقاعدة عامة، استخدم هذا لامتلاك صناعات قصيرة مثل عناوين المستندات، ولكن جرب DocStore لأشياء ضخمة مثل المحتوى. فيما يتعلق بذلك، استخدم كل من job_string بدلاً من job_string إلى محطة وظائف ذاكرة الوصول العشوائي (RAM)، أو keep_sphere بالإضافة إلى المجتمع لمحطة DocStore على محرك الأقراص الخاص بك، على التوالي.
دقائق رائعة تقضيها في تدليك حسي
فهارس Sphinx عبارة عن مجموعات شبه جاهزة من المستندات. ما الأفضل إذًا، استخدام عناكب RT purplepay payments ، أو تعريفات ملف sphinx.conf، أو تعليقات Perform Desk؟ لإضافة عمود جديد، يجب إما إعادة إنشاء فهرس جديد، أو استخدام ملف Transform.conf. يُمكّنك ملف التكوين من تشغيل عناكب RT. الموقع الأمثل لإنشاء ملف Transform هو sql_query_pre، والذي ينقلنا إلى إعدادات التكوين (أُشير إليها عادةً باسم "التوجيهات" في Sphinx). يجب أن يكون sql_query الأولي هو معرف المستند.

يجب أن تُرجع مخططات التأثيرات السابقة قيمة واحدة فقط (عدد عشري). ومع ذلك، علينا مراعاة بعض العمليات الحسابية (المجموع ونهاية الصف) عند معالجة الصفوف الجديدة. تتطلب عمليات التحديد المُفرطة قائمة مخصصة من الأعمدة و/أو تعبيرات OR، لذا يوجد دائمًا مخطط مجموعة نتائج. بالطبع، يجب أن يكون هناك دائمًا مخطط فهرس خاص، يصف نطاق القائمة وخصائصها. من البديهي أن تُجرى تحسينات على كل عملية هنا، ولكن مع ذلك، إذا استخدمت الكثير من العمليات الحسابية (لفرز أو تصفية نتائج الاستعلام)، فسيكون هناك تأثير على السرعة.
بعد كل ما سبق، لنبدأ بـ Find، وستجد أن البدء بسيط، بالنظر إلى الأسئلة الأبسط أولاً! بالإضافة إلى ذلك، فإن المواضيع المحددة، حتى وإن بدت متشابهة للوهلة الأولى، تحتاج إلى أقسام خاصة بها. تُعدّ MVAs (المعروفة أيضًا باسم خصائص إدخال الأعداد الصحيحة) الطريقة الوحيدة التي لا تعتمد على البحث والاستبدال المباشر (ربما يكفي استخدام تعبير نمطي بسيط).
عناكب FAISS_Mark
يمكن استخدام تلميحات متعددة، كما يمكن إدراج العديد من فهارس السمات في أي عملية استعلام تقريبًا. تُستخدم تلميحات الدليل غالبًا لضبط خيارات مُحسِّن الاستعلام ودمج قائمة السمات، وذلك للحصول على نتائج أو عوامل تصحيح الأخطاء. يُعد Find أداة الاستعلام الرئيسية، وبالتالي، يتضمن بنية جملة مفصلة للغاية (وربما معقدة بعض الشيء). هناك العديد من الأجزاء (أو الجمل) في بنية الجملة هذه. على سبيل المثال، لاحظ كيف يتم حذف ja great.c well worth. جميع المعتقدات القديمة الأخرى لا يتم حذفها. يمكن حذفه أو استبداله بمعتقدات جديدة.
