Re: [PATCH v4 08/16] reorganize indexing of multipart/signed and multipart/encrypted
[notmuch-archives.git] / 1c / a85f43199aa83f376cb747f8c80d6f348d5c8f
1 Return-Path: <eg@gaute.vetsj.com>\r
2 X-Original-To: notmuch@notmuchmail.org\r
3 Delivered-To: notmuch@notmuchmail.org\r
4 Received: from localhost (localhost [127.0.0.1])\r
5  by arlo.cworth.org (Postfix) with ESMTP id E6AB86DE02DA\r
6  for <notmuch@notmuchmail.org>; Sat, 11 Jun 2016 09:32:27 -0700 (PDT)\r
7 X-Virus-Scanned: Debian amavisd-new at cworth.org\r
8 X-Spam-Flag: NO\r
9 X-Spam-Score: -0.534\r
10 X-Spam-Level: \r
11 X-Spam-Status: No, score=-0.534 tagged_above=-999 required=5 tests=[AWL=0.186,\r
12   DKIM_SIGNED=0.1, DKIM_VALID=-0.1, RCVD_IN_DNSWL_LOW=-0.7,\r
13  RCVD_IN_MSPIKE_H3=-0.01, RCVD_IN_MSPIKE_WL=-0.01] autolearn=disabled\r
14 Received: from arlo.cworth.org ([127.0.0.1])\r
15  by localhost (arlo.cworth.org [127.0.0.1]) (amavisd-new, port 10024)\r
16  with ESMTP id 5htUAc3ln1DR for <notmuch@notmuchmail.org>;\r
17  Sat, 11 Jun 2016 09:32:19 -0700 (PDT)\r
18 Received: from mail-wm0-f41.google.com (mail-wm0-f41.google.com\r
19  [74.125.82.41]) by arlo.cworth.org (Postfix) with ESMTPS id E83A76DE01BE for\r
20  <notmuch@notmuchmail.org>; Sat, 11 Jun 2016 09:32:18 -0700 (PDT)\r
21 Received: by mail-wm0-f41.google.com with SMTP id v199so27145257wmv.0\r
22  for <notmuch@notmuchmail.org>; Sat, 11 Jun 2016 09:32:18 -0700 (PDT)\r
23 DKIM-Signature: v=1; a=rsa-sha256; c=relaxed/relaxed;\r
24  d=gaute-vetsj-com.20150623.gappssmtp.com; s=20150623;\r
25  h=date:from:subject:to:cc:references:in-reply-to:user-agent\r
26  :message-id:mime-version:content-transfer-encoding;\r
27  bh=cF9F4QF68lBd4ZlYSGL6Rg8R/az90WWQWTLJ4cN4Lag=;\r
28  b=tglDyXQtAKPsu4ez3d+tcn6LHngTvMCqFAQi6SsSCHdfOh2m7zndYHpF3PqjYcXp+v\r
29  RNGTGTAWFeomoZ5zKZYykurUWmALDQlemv99+4OcfzoMm5nF57aP7JEEkVuPuJloHJco\r
30  XAX62UxPPB7VR0N6MCC7FAAZrH0Ogb5i9jUBtYCH5srT0QzAa8dAhrFR4QaunU2ugkq1\r
31  Wy5TtFextQaT93EyiFfhFMy00vUT9i16vyJbJuXkqUy5/9GjBHSb1TBSByv2LZn6oKyR\r
32  +qFzWnG1JQJH9iDvGD0wankwTb9AxI3ZEkqwbDHIwEjx2EVlQWMFKFWvGXhnJsCQBadL\r
33  RLwA==\r
34 X-Google-DKIM-Signature: v=1; a=rsa-sha256; c=relaxed/relaxed;\r
35  d=1e100.net; s=20130820;\r
36  h=x-gm-message-state:date:from:subject:to:cc:references:in-reply-to\r
37  :user-agent:message-id:mime-version:content-transfer-encoding;\r
38  bh=cF9F4QF68lBd4ZlYSGL6Rg8R/az90WWQWTLJ4cN4Lag=;\r
39  b=VfPWWYdEcru/XOcrLbVHBR5j/jLFl4kaoNl6m/WQNwyJpY2DB4VpxlB+93Ukkimq9/\r
40  AA+zsjD+JOHPYPwTfZj7Ih8UBDqrPvVmqEBGlDbz9sl9LXB9KburKTX0nm3bU2gJNjJ7\r
41  8sbaBkamw8BH3DQsBAD33d7IGVFCnhKE8e5PwOgIj3oMr8wnxaTzmdGCvqZMmKbaZUfk\r
42  oJBJMe/F30eANUdLYlVK3aInGLQx4EEH/mmM7yIuu2s4D10KyOU83pxF9jrvUBQH3eFh\r
43  9nsVjOjFVJaoaOQo9Hx6HK2415GbcR4d6mnC8I/30JvbjJvteD24JrQO4FAA10YD2gw1\r
44  XZVg==\r
45 X-Gm-Message-State:\r
46  ALyK8tLRW5wR17fJSdFNgwlQ7MNRTHRhhFhsbMRW5dV1LseIAURRjCfXRQpKl1nkjumreQ==\r
47 X-Received: by 10.28.154.144 with SMTP id c138mr2525025wme.63.1465662737016;\r
48  Sat, 11 Jun 2016 09:32:17 -0700 (PDT)\r
49 Received: from localhost (241.89-20-241.enivest.net. [89.20.241.241])\r
50  by smtp.gmail.com with ESMTPSA id q71sm4879619wme.17.2016.06.11.09.32.15\r
51  (version=TLS1_2 cipher=ECDHE-RSA-AES128-GCM-SHA256 bits=128/128);\r
52  Sat, 11 Jun 2016 09:32:15 -0700 (PDT)\r
53 Date: Sat, 11 Jun 2016 16:32:14 +0000\r
54 From: Gaute Hope <eg@gaute.vetsj.com>\r
55 Subject: Re: [PATCH] WIP: regexp matching in 'subject' and 'from'\r
56 To: David Bremner <david@tethera.net>, Austin Clements\r
57  <aclements@csail.mit.edu>\r
58 Cc: sfischme@uwaterloo.ca, notmuch <notmuch@notmuchmail.org>\r
59 References: <1465265149-7174-1-git-send-email-david@tethera.net>\r
60  <1465525688-30913-1-git-send-email-david@tethera.net>\r
61  <1465547660-astroid-0-nudmv20lbk-1296@strange>\r
62  <87a8itxpu7.fsf@zancas.localnet>\r
63 In-Reply-To: <87a8itxpu7.fsf@zancas.localnet>\r
64 User-Agent: astroid/v0.5-221-g4c2c7173 (https://github.com/gauteh/astroid)\r
65 Message-Id: <1465662533-astroid-3-6vuqm3zu54-1296@strange>\r
66 MIME-Version: 1.0\r
67 Content-Type: text/plain; charset=utf-8; format=flowed\r
68 Content-Transfer-Encoding: quoted-printable\r
69 X-BeenThere: notmuch@notmuchmail.org\r
70 X-Mailman-Version: 2.1.20\r
71 Precedence: list\r
72 List-Id: "Use and development of the notmuch mail system."\r
73  <notmuch.notmuchmail.org>\r
74 List-Unsubscribe: <https://notmuchmail.org/mailman/options/notmuch>,\r
75  <mailto:notmuch-request@notmuchmail.org?subject=unsubscribe>\r
76 List-Archive: <http://notmuchmail.org/pipermail/notmuch/>\r
77 List-Post: <mailto:notmuch@notmuchmail.org>\r
78 List-Help: <mailto:notmuch-request@notmuchmail.org?subject=help>\r
79 List-Subscribe: <https://notmuchmail.org/mailman/listinfo/notmuch>,\r
80  <mailto:notmuch-request@notmuchmail.org?subject=subscribe>\r
81 X-List-Received-Date: Sat, 11 Jun 2016 16:32:28 -0000\r
82 \r
83 David Bremner writes on juni 10, 2016 13:09:\r
84 > Gaute Hope <eg@gaute.vetsj.com> writes:\r
85 >=20\r
86 >>\r
87 >> Cool!\r
88 >>\r
89 >> Would it break a lot of things if you just replace the original prefix?\r
90 >=20\r
91 > It would change the matching behaviour. I guess there are people that\r
92 > like the current "sloppy" matching of from: and subject:.  In my\r
93 > not-very-scientific tests, it is a factor of 5 to 10 times slower to do\r
94 > regexp search, which makes sense because it is effectively post\r
95 > processing the results from Xapian. At least on my system it seems fast\r
96 > enough to be usable interactively, but that is a pretty shocking\r
97 > performance regression. And I know there are people with more mail on\r
98 > slower systems.\r
99 \r
100 Maybe we could check if the search string contains a regexp and decide\r
101 whether to pre-process it on the background of that? I think that would\r
102 make the interface more user-friendly. You'd just always use search\r
103 whether you decide that you need to put in some regexp or not.\r
104 \r
105 >=20\r
106 >> Could it be made to work on the message body?\r
107 >=20\r
108 > See Austin's previous reply for the details, but basically no; these\r
109 > "values" index in terms of whole strings, while the body is indexed by\r
110 > terms (roughly, words). In principle we could add a value slot for the\r
111 > body, but I think that would at least double the size of the database\r
112 > (maybe more).\r
113 >=20\r
114 \r
115 I would rather have double the db and be able wildcard beginning of\r
116 terms. If it is not too much maintaining overhead it might be made\r
117 optional?\r
118 \r
119 \r
120 Regards, Gaute\r
121 \r
122 =\r