[SOLR-13393] ZkClientClusterStateProvider can leak ZkStateReader (and associated watcher threads) if background threads attempt to use it after close() . - ASF JIRA

XML

Word

Printable

JSON

Details

Type: Bug
Status: Closed
Priority: Major
Resolution: Fixed
Affects Version/s: None
Fix Version/s: 8.1, 9.0
Component/s: None
Labels:
None

Description

while digging into some test failures related to leaked ZkStateReader objects, i noticed a pattern which i beleive can be explained by the fact that ZkClientClusterStateProvider does not complain/fail if some caller tries to connect()/use it after it's already been closed – in this situation it will just re-create a new ZkStateReader (which is later leaked)

So in in situations where background/timer threads use a SolrClientCloudManager/ZkClientClusterStateProvider, we might see...

T1 : start shutdown...
T1 :  ...SolrClientCloudManager.close()...
T1 :   ...ZkClientClusterStateProvider.close()...
T1 :    ...ZkStateReader.close()
T1 :    ...zkStateReader = null;
T 2: run background thread/task/trigger...
T 2:  ...get ZkClientClusterStateProvider
T 2:  ...call ZkClientClusterStateProvider.connect()
T 2:   ...zkStateReader = new ZkStateReader()                 /* LEAKED */
T 2:  ... do something with ZkClientClusterStateProvider
T 2:  ...finish background thread/task/trigger
T1 :  ...finish shutdown of ZkClientClusterStateProvider / SolrClientCloudManager

Attachments

- Sort By Name
- Sort By Date
- Ascending
- Descending

SOLR-13393.patch
11/Apr/19 00:30
1 kB
Chris M. Hostetter
SOLR-13393.patch
11/Apr/19 01:51
10 kB
Chris M. Hostetter
SOLR-13393.patch
11/Apr/19 18:12
11 kB
Chris M. Hostetter

Activity

People

Assignee:: Chris M. Hostetter

Reporter:: Chris M. Hostetter

Votes:: 0 Vote for this issue

Watchers:: 3 Start watching this issue

Dates

Created:: 11/Apr/19 00:29

Updated:: 12/May/22 00:26

Resolved:: 11/Apr/19 21:27