خبرهای فارسی

اخبار موسیقی، اخبار آی تی، اخبار ورزشی، اخبار استخدام

خبرهای فارسی

اخبار موسیقی، اخبار آی تی، اخبار ورزشی، اخبار استخدام

همه چیز درباره موتور جستجوی پارسی‌جو+عکس

Parsijoo Logo.png

این سامانه با تلاشهای بی‌وقفه تیم ۴۰ نفره شرکت پارسی‌جو در مرکز تحقیقات مهندسی دانشگاه یزد با حمایت پژوهشگاه ارتباطلات و فناوری اطلاعات پیاده سازی شده و با صرف حداقل هزینه و تجهیزات به رشد و توسعه خود ادامه می‌دهد. در حال حاضر موتور پارسی‌جو بر روی یک بستر توزیع شده شامل ۳۰ سیستم اجرا می‌شود و تاکنون در حدود ۲۰۰ میلیون صفحه فارسی (از ۵۰۰ میلیون سند) را نمایه‌سازی نموده است. همچنین این سامانه مجهز به پردازشگر و خطایاب هوشمند فارسی می‌باشد.


تاریخچه موتورجستجوی پارسی‌جو

فاز تحقیقاتی پروژه در شهریور ۱۳۸۷ شروع شده و طراحی و پیاده سازی پارسیجو در مهر ۱۳۸۸ آغاز گردید و نسخه ۱ در ۲۸ اردیبهشت ۱۳۸۹ با پوشش یک میلیون صفحه روی وب قرار گرفت. هم اکنون نسخه ۳ پارسی جو با پوشش دویست میلیون صفحه روی وب قرار دارد.


معماری پارسی‌جو

پارسی‌جو موتور جستجویی مستقل و بومی است که شامل سه بخش اصلی می‌باشد.

الف) خزشگر (crawler) :
خزشگر پارسی‌جو که Parsijoo نام دارد به صورت هوشمند وب را پیمایش نموده و صفحات را جمع آوری میکند. در حال حاضر خزشگر پارسی‌جو، قادر به خزش دویست میلیون صفحه وب به صورت متوالی میباشد. نسخه جدید آن که بزودی بر روی وب قرار میگیرد قادر است بیش از یک میلیارد صفحه وب را جمعآوری کند. در این بخش اسناد وب فارسی با یک سیاست مناسب بر مبنای پوشش و تازگی از وب جمع‌آوری می‌شو‌ند. یکی از مباحث مهم این بخش کشف صفحات مهم فارسی می‌شود که این عمل با استفاده از الگوریتم جدید هوشمند به نام ایساتیس انجام می‌گیرد. روش ایساتیس که توسط طراحان پارسی جو ارائه شده است صفحات مهم فارسی را کشف کرده و سپس بارگذاری می‌کند. همچنین این الگوریتم قادر به تشخیص صفحات فرب آمیز (اسپم) میباشد.

ب) نمایه ساز:
در این بخش متن خالص از اسناد فارسی (مانند HTML، DOC و PDF) بارگذاری شده، توسط خزشگر استخراج شده و با توجه به خصوصیات زبان فارسی نرمال سازی شده و سپس عمل نمایه سازی انجام می‌گیرد. در این بخش از یک پردازشگر فارسی برای پردازش کلمات و عبارات فارسی استفاده میشود که این پردازشگر قادر است عملیات فاصله گذاری و یکسان سازی کدینگ‌های استفاده شده را انجام دهد. همچنین تصاویر و بقیه اسناد در این بخش پردازش میشوند. کل این مجموعه عملیات بر روی یک بستر توزیع شده اجرا میگردد.

ج) بخش بازیابی و جستجو:
این بخش که به صورت برخط عمل می کند و با کاربر در ارتباط است، در ابتدا پرس‌جو را از کاربر گرفته و پس از پردازش آن، اسناد مرتبط را از بخش نمایه‌ساز بازیابی می‌کند. در نهایت اسناد با استفاده از روش‌های هوشمند رتبه بندی جدید که به صفحات فریب آمیز (اسپم) حساسیت پایینی دارند، رتبهبندی گردیده و به کاربر ارائه می شوند. الگوریتم رتبه بندی ارائه شده بیش از ۵۰ ویژگی سایت های فارسی را با هم به صورت هوشمند ترکیب میکند تا نتایج ارائه شده مورد رضایت کاربران باشد. این الگوریتم نوین توسط تیم پارسی‌جو طراحی و ارائه شده است. همچنین پردازشگر پرس‌وجوی این بخش قادر است عملیات یکسان سازی کدینگ‌ها، ریخت شناسی صرفی و خطایابی را انجام دهد.


خدمات پارسی جو

۱) وب:
این خدمت در بین ۲۰۰ میلیون صفحه فارسی جستجو میکند. با توجه به اینکه صفحات وب از طریق گذرگاه رسمی شبکه کشور دریافت شده‌اند، دارای محتویات امن و مطمئن می‌باشند. بزودی، نسخه جدیدی از پارسی‌جو به بهره‌برداری می‌رسد که امکان جستجو در بیش از ۵۰۰ میلیون صفحه وب فارسی و در زمانی بسیار کوتاهتر را فراهم می‌سازد و در ضمن، کیفیت صفحات انتخابی نیز از نظر ارزش اطلاعاتی و رتبه‌بندی بهبود قابل توجهی یافته است.

۲) تصویر:
این خدمت در بین میلیون ها تصویر جستجو میکند. این تصاویر عمدتاً از صفحات وب فارسی استخراج شده‌اند و همانند جستجوی وب، سرویس جستجوی تصویر نیز تا حد امکان دارای محتویات امن و مطمئن می‌باشد. بزودی، پارسی‌جو قادر به جستجو در بیش از یکصد میلیون عکس موجود در وب خواهد بود.

۳) خبر:
این سرویس به صورت هوشمند بیش از پنجاه سایت خبرگزاری را دسته‌بندی کرده و در اختیار کاربران قرار میدهد.

۴) ترجمه ماشینی:
این سرویس قابلیت ترجمه دو زبانه متن از فارسی به انگلیسی، انگلیسی به فارسی و پینگلیش به فارسی به همراه فرهنگ لغت انگلیسی به فارسی را دارا می‌باشد . نسخه آزمایشی این سرویس به صورت روزانه در حال بهبود و بروزرسانی می‌باشد. خدمت ترجمه مبتنی بر روش ترجمه ماشینی هوشمند آماری عمل کرده و از ترجمه ماشینی ترگمان که توسط دانشگاه صنعتی امیرکبیر پیاد‌سازی شده است، استفاده میکند.

۵) آوا:
سرویس آوا با امکان جستجو،دانلود و پخش صوت و موسیقی در حجم انبوهی از فایلهای صوتی موجود در سطح وب فارسی را در اختیار کاربران قرار میدهد.

۶) علمی:
این خدمت در بین یک میلیون مقاله انگلیسی و فارسی جستجو میکند. بزودی تعداد مقالات تحت پوشش چند برابر خواهد شد.

گفتنی است نسخه موبایل پارسی‌جو نیز به بهره‌برداری رسیده است و تمام سرویسهای فوق به راحتی با استفاده از گوشی‌های هوشمند تلفن همراه در دسترس می‌باشند.

تیم پارسی‌جو به صورت شبانه‌روزی در حال تحقیق و فعالیت برای بهبود و ارتقاء این موتور جستجو می‌باشد و در آینده‌ای نزدیک شاهد بهره‌برداری از سرویسهای جدیدی خواهیم بود.


کاربر گرامی، دلگرمی ناشی از استفاده شما از پارسی جو، هر روز باعث افزایش کیفیت آن و ارائه خدمات بیشتر می‌شود. خواهشمند است با ارسال نظرات خود در بخش بازخورد، ما را در بهبود این سامانه یاری نمایید.

 

بازتاب اعتراضات اخیر در رسانه ها (به روز رسانی مجدد)/تجدید نظر ایرانسل قطعی است

وزیر ارتباطات عنوان کرد:

 تجدید نظر در تعرفه ها، به نفع اپراتور است

وزیر ارتباطات و فناوری اطلاعات در حاشیه مراسم پایان هم کد سازی تلفن ثابت در کشور، اعلام کرد: اگرچه ایرانسل در ارائه تعرفه های جدید تخلف نکرده، اما به دلیل اعتراض مشترکین خود، اعلام کرده که در حال تجدید نظر در تعرفه هاست.

  

دانلود گزارش خبری شبکه پنج سیما از گران شدن تعرفه اینترنت همراه

گزارش خبرگزاری فارس از اعتراضات شدید در شبکه های اجتماعی به اقدام ایرانسل

* همچنین به اطلاع می رساند، ایرانسل در اقدام زشت دیگری اعتراضات کاربران را در صفحات شخصی خود در کلوب و اینستاگرام سانسور نموده و بنابر گزارش های رسیده، حتی کاربران متعددی را بلاک (مسدود) نموده است تا نتوانند در این صفحات به اظهار نظر بپردازند.

اینترنت چیست؟

هم اکنون ما در حال تولید نسل دوم صفحات وب قرار داریم. همانطوریکه می دانیم در نسل اول صفحات HTML توسط دست بشر طراحی می شد مستقیماً توسط وی مورد پردازش قرار می گرفت. در حالی که صفحات وب در نسل دوم به ....

ادامه این مطلب را از دست ندهید!

Atlantis Word Processor 1.6.6.2 + Portable جایگزین Word

Atlantis Word Processor 1.6.6.2 نرم افزاری است که شما به وسیله آن می توانید فایل های متنی خود را ویرایش و به ور کاملا حرفه ای طراحی کنید. این نرم افزار محصولی از شرکت نرم افزاری ATLANTIS  است. این نرم افزار همانند برنامه word از امکانات و گزینه های متعددی برخوردار می باشد. در این برنامه شما توانایی تایپ متون و قرار دادن عکس در میان صفحات و همچنین قرار دادن افکت های نمایشی به همراه تصاویر کوچک متحرک در میان صفحات را دارید. این نرم افزار هم اکنون یکی از پرطرفدارترین برنامه ها در زمینه ساخت سند های متنی می باشد و در حال رقابتی سخت با نرم افزار MS Word می باشد.

نسخه جدید مرورگر اپرا Opera 25.0 Build 1614.50 Final

مرورگر محبوب Opera که کاربران خاص خودش را دارد. این مرورگر محبوب و قدیمی زمانی به عنوان رقیب اصلی فایرفاکس و IE رقابت داشت که با روی کار آمدن گوگل کروم با ریزش قابل توجه کاربر مواجه شد و نتوانست مثل گذشته به پیشرفت خود ادامه دهد. با این حال این مرورگر هنوز هم از نظر امکانات چیزی نسبت به رقیبانش کم ندارد و میتواند به عنوان یک انتخاب خوب برای وبگردی سریع و مطمئن مورد استفاده قرار گیرد. شاخصه اصلی مرورگر Opera سرعت بالای آن در کنار سادگی و استفاده کم از منابع سرور می باشد. از نظر زیبایی محیط نرم افزار اپرا یکی از پیشگامان محیط زیبا و کاربر پسند در میان دیگر مرورگرها بوده است. قابلیت ویژه و اختصاصی دیگر این مرورگر Opera Turbo نام دارد که برای افرادی است که از سرعت اینترنت پایین رنج می برند. این قابلیت با فشرده سازی صفحات وب و همچنین دانلود عکس ها به صورت کم حجم باعث سرعت بیشتر در بارگزاری صفحات خواهد شد. قابلیت پایه ای دیگری مانند tabbed browsing و مدیریت پسورد ها نیز در این مرورگر محبوب و قدیمی جای گرفته اند.