OpenSearch
阿里雲開放搜索
OpenSearch是阿里雲開放搜索簡稱,為解決用戶結構化數據搜索需求的託管服務,支持數據結構、搜索排序、數據處理自由定製。
阿里雲開放搜索服務OpenSearch (簡稱OpenSearch )基於阿里巴巴自主研發的大規模分散式搜索引擎平台(該平台承載了阿里集團所有主要搜索業務)搭建而成。其主要為解決用戶結構化數據搜索需求的託管服務,支持數據結構、搜索排序、數據處理自由定製。開放搜索服務主要為的網站或應用程序提供簡單、低成本、穩定、高效的搜索解決方案。
1、文檔索引結構定製,以及自由修改
將搜索引擎複雜的索引結構概念簡單化、可視化和自助定製化。開發者可以通過控制台創建搜索應用,定製文檔欄位的結構和屬性,包括欄位名稱、類型、分詞方式、搜索屬性等。搜索應用在運行過程中可以自由修改,滿足了產品快速變化的需求,極大縮短了需求變更到上線的過程。
2、主流阿里雲存儲產品的自動對接,數據自動同步更新
開發者只需要在控制台中授權,數據就可以自動同步至OpenSearch中,後續數據的更新也可以自動實時同步。
3、多表數據推送,及欄位文本處理和轉換
類似於資料庫,每個搜索應用可以創建一張或者多張表,每張表的欄位上可以內置數據處理插件,對欄位內容做文本處理和轉換,例如拼音轉換、HTML標籤剔除、JSON數據解析等,多個表會Join在一起實現聯合查詢。
4、兩輪相關性排序定製,簡單靈活加速產品效果優化迭代
索結果相關性排序是影響用戶體驗最關鍵的一環,OpenSearch支持開發者定製兩輪相關性排序規則來準確控制搜索結果的排序。第一輪為粗排,從命中的文檔集合裏海選出相關文檔。第二輪為精排,對粗排的結果做更精細篩選,支持任意複雜的表達式和語法。方便開發者能更準確控制排序效果,優化系統性能,提高搜索響應速度。
開放搜索團隊為阿里集團內部上百個產品和應用提供搜索服務
2014年7月
• 在阿里雲上雲發布,開始對外公測
2014年9月
• ODPS源自動對接OpenSearch上線;
• in_polygon、in_query_polygon等新插件function發布,為O2O用戶提供更優質的搜索效果體驗;
• API/SDK推送文檔用戶指定時間戳保序功能發布,方便多線程用戶更好的控制文檔更新流程
2014年10月
• 分區域部署上線,支持杭州區域;
• JAVA SDK V2.1.1發布:優化調試信息列印、增加超時時間設置、gzip方式支持、最大連接數設置、開放rerake_size參數等;
• PHP SDK V2.0.4發布:取消默認時區、優化調試信息列印、增加超時時間設置、開放rerank_size參數等;
• 配額預警功能上線,文檔即將超配額自動郵件通知,提醒用戶及時修正
2014年11月
• 實時引擎發布,數據處理時效性(從數據推送到系統到能檢索到)達到10+秒級別;
• 創建、修改應用結構流程優化:去掉多值欄位,改為新增ARRAY類型,更方便用戶理解;去掉可聚合類型,引擎對於可聚合與可過濾處理邏輯相同,勾選可過濾即可支持原可聚合的功能。
2014年12月
• 附表數據自動更新功能發布,無需用戶手動觸發主表即可生效
2015年1月正式對外開放搜索服務
• 錯誤碼優化,方便用戶排查問題;
• 應用結構流程優化,數據源及索引重建功能拆分,優化用戶導入數據體驗
2015年2月
• QP一期重磅發布,新增提供公共詞典的糾錯、停用詞、詞權重等查詢分析功能,可以讓用戶更好的干預搜索結果,以獲得更好的搜索體驗;
• ODPS支持分區等功能,方便用戶做全量數據版本控制
2015年3月
• 北京機房上線,支持北京區域;
• 新增多粒度MWS_TEXT及用戶自定義NWS_TEXT分詞欄位類型,提供更強大的分詞功能,提高召回率。