Re: [PATCH 2/3] doc: add material on stemming and wildcards
authorJani Nikula <jani@nikula.org>
Mon, 23 Feb 2015 18:18:56 +0000 (20:18 +0200)
committerW. Trevor King <wking@tremily.us>
Sat, 20 Aug 2016 21:48:07 +0000 (14:48 -0700)
3a/3dafd83b29ae61029a0f007c4e530286d7e66e [new file with mode: 0644]

diff --git a/3a/3dafd83b29ae61029a0f007c4e530286d7e66e b/3a/3dafd83b29ae61029a0f007c4e530286d7e66e
new file mode 100644 (file)
index 0000000..09ee0f3
--- /dev/null
@@ -0,0 +1,125 @@
+Return-Path: <jani@nikula.org>\r
+X-Original-To: notmuch@notmuchmail.org\r
+Delivered-To: notmuch@notmuchmail.org\r
+Received: from localhost (localhost [127.0.0.1])\r
+       by olra.theworths.org (Postfix) with ESMTP id 60902431FDE\r
+       for <notmuch@notmuchmail.org>; Mon, 23 Feb 2015 10:26:58 -0800 (PST)\r
+X-Virus-Scanned: Debian amavisd-new at olra.theworths.org\r
+X-Spam-Flag: NO\r
+X-Spam-Score: 1.738\r
+X-Spam-Level: *\r
+X-Spam-Status: No, score=1.738 tagged_above=-999 required=5\r
+       tests=[DNS_FROM_AHBL_RHSBL=2.438, RCVD_IN_DNSWL_LOW=-0.7]\r
+       autolearn=disabled\r
+Received: from olra.theworths.org ([127.0.0.1])\r
+       by localhost (olra.theworths.org [127.0.0.1]) (amavisd-new, port 10024)\r
+       with ESMTP id fUiwS2hpzH3b for <notmuch@notmuchmail.org>;\r
+       Mon, 23 Feb 2015 10:26:55 -0800 (PST)\r
+Received: from mail-wg0-f52.google.com (mail-wg0-f52.google.com\r
+ [74.125.82.52])       (using TLSv1 with cipher RC4-SHA (128/128 bits))        (No client\r
+ certificate requested)        by olra.theworths.org (Postfix) with ESMTPS id\r
+ 00293431FDA   for <notmuch@notmuchmail.org>; Mon, 23 Feb 2015 10:26:54 -0800\r
+ (PST)\r
+Received: by wggx12 with SMTP id x12so450957wgg.11\r
+       for <notmuch@notmuchmail.org>; Mon, 23 Feb 2015 10:18:40 -0800 (PST)\r
+X-Google-DKIM-Signature: v=1; a=rsa-sha256; c=relaxed/relaxed;\r
+       d=1e100.net; s=20130820;\r
+       h=x-gm-message-state:from:to:subject:in-reply-to:references\r
+       :user-agent:date:message-id:mime-version:content-type;\r
+       bh=HnX0CXs9d/+kMmMx1NokqzwdmsAGaM9Os7MFsUcWOJI=;\r
+       b=YDLPeVxecOWKKxlIDaFDw2XTX61KhNH4vxhxMZi6IolZNOzXl2ZANj7ev3a5fsOYV/\r
+       dthcDG8o1Uc29TFN3n/1SmewN0bno5jS666xBYP3jAFzDN+HeQKWSk1vqxS+qQ4UxVwL\r
+       gE+/0KhF4zWgpNcp0r0Y1msnAquCn4dmjO4RyzRNvOzbDuAsVfkodKupN+m8AnRG7LDH\r
+       tJ5GM9a6jw+9+ctbMezEZ6YHvyylcJetbIc/7yMN58L3KwCwfiQJHG4uRigyWYQKpGGT\r
+       T1SE+Rpc1qqdMmAJzMmPbdr1b8pYK+4/l9nTB00wFPbuQ7WBlALSX6BLD66TOV/zsHjU\r
+       Nyuw==\r
+X-Gm-Message-State:\r
+ ALoCoQm7g0Ft/4lctnoZNKGzEIsiQYQdYAMQZC78JlMt29dTOFrX0+TGTuf4HNGpo4xSG+xNCE8z\r
+X-Received: by 10.180.78.3 with SMTP id x3mr23358077wiw.86.1424715519965;\r
+       Mon, 23 Feb 2015 10:18:39 -0800 (PST)\r
+Received: from localhost (mobile-internet-bcee3b-76.dhcp.inet.fi.\r
+       [188.238.59.76])\r
+       by mx.google.com with ESMTPSA id m4sm56659472wjb.25.2015.02.23.10.18.38\r
+       (version=TLSv1.2 cipher=ECDHE-RSA-AES128-GCM-SHA256 bits=128/128);\r
+       Mon, 23 Feb 2015 10:18:39 -0800 (PST)\r
+From: Jani Nikula <jani@nikula.org>\r
+To: David Bremner <david@tethera.net>, David Bremner <david@tethera.net>,\r
+       notmuch@notmuchmail.org\r
+Subject: Re: [PATCH 2/3] doc: add material on stemming and wildcards\r
+In-Reply-To: <1421585971-29949-2-git-send-email-david@tethera.net>\r
+References: <87h9vojsa0.fsf@nikula.org>\r
+       <1421585971-29949-1-git-send-email-david@tethera.net>\r
+       <1421585971-29949-2-git-send-email-david@tethera.net>\r
+User-Agent: Notmuch/0.19+49~g2049205 (http://notmuchmail.org) Emacs/24.4.1\r
+       (x86_64-pc-linux-gnu)\r
+Date: Mon, 23 Feb 2015 20:18:56 +0200\r
+Message-ID: <8761as5w4v.fsf@nikula.org>\r
+MIME-Version: 1.0\r
+Content-Type: text/plain\r
+X-BeenThere: notmuch@notmuchmail.org\r
+X-Mailman-Version: 2.1.13\r
+Precedence: list\r
+List-Id: "Use and development of the notmuch mail system."\r
+       <notmuch.notmuchmail.org>\r
+List-Unsubscribe: <http://notmuchmail.org/mailman/options/notmuch>,\r
+       <mailto:notmuch-request@notmuchmail.org?subject=unsubscribe>\r
+List-Archive: <http://notmuchmail.org/pipermail/notmuch>\r
+List-Post: <mailto:notmuch@notmuchmail.org>\r
+List-Help: <mailto:notmuch-request@notmuchmail.org?subject=help>\r
+List-Subscribe: <http://notmuchmail.org/mailman/listinfo/notmuch>,\r
+       <mailto:notmuch-request@notmuchmail.org?subject=subscribe>\r
+X-List-Received-Date: Mon, 23 Feb 2015 18:26:58 -0000\r
+\r
+On Sun, 18 Jan 2015, David Bremner <david@tethera.net> wrote:\r
+> This is lightly massaged from the searching page on the wiki.\r
+> ---\r
+>  doc/man7/notmuch-search-terms.rst | 28 ++++++++++++++++++++++++++++\r
+>  1 file changed, 28 insertions(+)\r
+>\r
+> diff --git a/doc/man7/notmuch-search-terms.rst b/doc/man7/notmuch-search-terms.rst\r
+> index 52f6804..3b27053 100644\r
+> --- a/doc/man7/notmuch-search-terms.rst\r
+> +++ b/doc/man7/notmuch-search-terms.rst\r
+> @@ -129,6 +129,34 @@ operators, but will have to be protected from interpretation by the\r
+>  shell, (such as by putting quotation marks around any parenthesized\r
+>  expression).\r
+>  \r
+> +Stemming\r
+> +--------\r
+> +\r
+> +**Stemming** in notmuch means is that these searches\r
+\r
+Unnecessary "is"?\r
+\r
+> +\r
+> +::\r
+> +\r
+> +        notmuch search detailed\r
+> +        notmuch search details\r
+> +        notmuch search detail\r
+> +\r
+> +will all return identical results, because Xapian first "reduces" the\r
+> +term to the common stem (here 'detail') and then performs the search.\r
+> +\r
+> +There are two ways to turn this off: a search for a capitalized word\r
+> +will be performed unstemmed, so that one can search for "John" and not\r
+> +get results for "Johnson"; phrase searches are also unstemmed (see\r
+> +below for details).  Stemming is currently only supported for\r
+> +English. Words in other languages will be performed unstemmed unless\r
+\r
+Maybe end the sentence here, and drop this line:\r
+\r
+> +somebody teaches Xapian how to perform stemming for that language.\r
+> +\r
+> +Wildcards\r
+> +---------\r
+> +\r
+> +It is possible to use a trailing '\*' as a wildcard. A search for\r
+> +'wildc\*' will match 'wildcard', 'wildcat', etc.\r
+> +\r
+> +\r
+>  Boolean and Probabilistic Prefixes\r
+>  ----------------------------------\r
+>  \r
+> -- \r
+> 2.1.4\r