Bạn đang xem trang 1 / 1 trang

Tìm kiếm theo 'ý tưởng' thay vì từ khoá

Gửi bàiĐã gửi: 16 Tháng 7 2010, 14:26
gửi bởi Zelda

IBM đang có kế hoạch cung cấp một công nghệ mới nhằm khôi phục văn bản bằng cách sử dụng khái niệm chung và nội dung dữ liệu thay vì kiểu tìm theo từ khoá đơn giản như Google.

Dù công cụ tìm kiếm bằng từ khoá đã làm nên một cuộc cách mạng, ảnh hưởng lớn đến cách người dùng Internet xác định và lấy thông tin, IBM tin rằng phương pháp mà họ đang phát triển có khả năng chọn lọc dữ liệu ưu việt hơn.

Internet phát triển cùng với sự bùng nổ của thông tin không kết cấu (Unstructured Information) trên web dưới dạng tài liệu, hình ảnh, lời bình, ghi chú, thư điện tử và file nghe nhìn. Tuy nhiên chưa có phần mềm nào có thể tìm kiếm và hiểu ý nghĩa của những loại dữ liệu "tạp nham" như thế. Theo Arthur Ciccolo, Trưởng nhóm công nghệ tìm kiếm của IBM, hiện nay không có nhiều hãng lớn chuyển sang nghiên cứu lĩnh vực này. Công cụ của Google, Yahoo và Microsoft đều tập trung vào những gì phổ biến trên mạng thay vì khôi phục dữ liệu hồ sơ cá nhân.

IBM dự định cung cấp cho các nhà phát triển phần mềm chương trình UIMA (Unstructured Information Management Architecture - Sơ đồ quản lý thông tin không kết cấu), một công nghệ có khả năng phân tích văn bản và những file nghe nhìn khác để hiểu những ý nghĩa, mối quan hệ và số liệu tiềm ẩn bên trong tài liệu. Khoảng 15 công ty đã quyết định sử dụng UIMA như là khung tìm kiếm và phân tích văn bản cho những dữ liệu không kết cấu của họ.

IBM đồng thời xây dựng phần mềm WebSphere OmniFind nhằm hỗ trợ người sử dụng thực hiện tìm kiếm thông tin không kết cấu trên nhiều định dạng và ngôn ngữ khác nhau như trong cơ sở dữ liệu, e-mail, và file âm thanh.

Khung tìm kiếm dữ liệu kiểu mới là kết quả hơn 4 năm phát triển của IBM. Hãng hy vọng sẽ ra mắt UIMA rộng rãi vào cuối năm nay. Mô hình UIMA có thể được tải miễn phí từ AlphaWorks của IBM.

P.T. (theo Reuters)

Sưu tầm từ vnexpress