Java中的groupingby方法用于將流中的元素按指定規則分組并返回map,其核心是通過function定義分組規則。1. 最基本形式為傳入一個function確定分組key,如按person的age屬性分組;2. 可搭配下游collector實現更復雜操作,如用collectors.counting()統計每組數量,或用collectors.mapping()映射元素生成新列表;3. groupingby支持多級分組,例如先按省份再按城市分組,通過嵌套使用groupingby完成;4. key可以為NULL,此時所有對應元素歸為一組,但需注意性能和下游collector對null的支持;5. groupingby還可結合如toset、summingint、maxby等多種collector以滿足不同數據處理需求。
Java中的groupingBy方法,簡單來說,就是把一個流(Stream)里的元素按照你指定的規則分成不同的組,最后返回一個Map,這個Map的key就是分組的規則,value就是屬于這個組的元素列表。它能讓你更方便地處理集合數據,不用自己寫循環和條件判斷。
流元素分組的實現方法主要依賴于Collectors.groupingBy()這個靜態方法。它有多種重載形式,可以滿足不同的分組需求。最基本的形式是傳入一個Function,這個Function定義了分組的規則。
解決方案
立即學習“Java免費學習筆記(深入)”;
groupingBy的核心在于定義分組的“規則”。這個規則通過Function接口來實現,這個Function接收流中的每個元素作為輸入,返回一個值,這個值就是該元素所屬的組的key。
例如,假設我們有一個List,Person類包含name和age兩個屬性,我們想按照年齡分組:
List<Person> people = Arrays.asList( new Person("Alice", 25), new Person("Bob", 30), new Person("Charlie", 25), new Person("David", 30), new Person("Eve", 35) ); Map<Integer, List<Person>> peopleByAge = people.stream() .collect(Collectors.groupingBy(Person::getAge)); System.out.println(peopleByAge); // 輸出:{25=[Person{name='Alice', age=25}, Person{name='Charlie', age=25}], 30=[Person{name='Bob', age=30}, Person{name='David', age=30}], 35=[Person{name='Eve', age=35}]}
這里,Person::getAge就是一個Function,它接收一個Person對象,返回這個人的年齡。groupingBy方法會根據這個年齡把所有的人分成不同的組。
除了最簡單的形式,groupingBy還支持更復雜的分組方式。例如,你可以指定一個下游的Collector,用于對每個組的元素進行進一步的處理。
比如,我們想按照年齡分組,但是只統計每個年齡段的人數,而不是把所有的人都放到一個List里:
Map<Integer, Long> countByAge = people.stream() .collect(Collectors.groupingBy(Person::getAge, Collectors.counting())); System.out.println(countByAge); // 輸出:{25=2, 30=2, 35=1}
這里,我們使用了Collectors.counting()作為下游的Collector,它會統計每個組的元素個數。
再比如,我們想按照年齡分組,但是只保留每個年齡段的人的名字列表:
Map<Integer, List<String>> namesByAge = people.stream() .collect(Collectors.groupingBy(Person::getAge, Collectors.mapping(Person::getName, Collectors.toList()))); System.out.println(namesByAge); // 輸出:{25=[Alice, Charlie], 30=[Bob, David], 35=[Eve]}
這里,我們使用了Collectors.mapping()作為下游的Collector,它會把每個Person對象映射成一個名字,然后把所有的名字放到一個List里。
總之,groupingBy是一個非常強大的方法,它可以讓你以各種方式對流中的元素進行分組。
groupingBy的key可以是null嗎?如果key是null會發生什么?
groupingBy的key是可以為null的。如果key是null,那么所有key為null的元素會被分到同一個組。但是,你需要注意,如果你的數據中有大量的null key,可能會導致某個組的元素非常多,影響性能。此外,如果你的下游Collector不支持null值,可能會拋出NullPointerException。
例如:
List<String> names = Arrays.asList("Alice", null, "Bob", null, "Charlie"); Map<String, List<String>> groupedNames = names.stream() .collect(Collectors.groupingBy(name -> name)); System.out.println(groupedNames); // 輸出:{null=[null, null], Alice=[Alice], Bob=[Bob], Charlie=[Charlie]}
在這個例子中,null被當作一個有效的key,所有為null的元素都被分到了同一個組。
如何使用groupingBy進行多級分組?例如先按省份分組,再按城市分組
groupingBy支持多級分組,只需要在下游的Collector中再次使用groupingBy即可。
例如,假設我們有一個List
,Address類包含province和city兩個屬性,我們想先按照省份分組,再按照城市分組:List<Address> addresses = Arrays.asList( new Address("Guangdong", "Guangzhou"), new Address("Guangdong", "Shenzhen"), new Address("Guangxi", "Nanning"), new Address("Guangxi", "Guilin") ); Map<String, Map<String, List<Address>>> addressesByProvinceAndCity = addresses.stream() .collect(Collectors.groupingBy(Address::getProvince, Collectors.groupingBy(Address::getCity))); System.out.println(addressesByProvinceAndCity); // 輸出:{Guangdong={Guangzhou=[Address{province='Guangdong', city='Guangzhou'}], Shenzhen=[Address{province='Guangdong', city='Shenzhen'}]}, Guangxi={Nanning=[Address{province='Guangxi', city='Nanning'}], Guilin=[Address{province='Guangxi', city='Guilin'}]}}
在這個例子中,我們首先按照省份分組,然后對每個省份的地址列表,再次按照城市分組。最終得到一個Map>>,外層的key是省份,內層的key是城市,value是屬于這個省份和城市的地址列表。
除了toList()和counting(),groupingBy還能搭配哪些其他的Collector使用?
groupingBy可以搭配很多其他的Collector使用,常用的包括:
- Collectors.toSet(): 將每個組的元素收集到一個Set中,可以去重。
- Collectors.toMap(keyMapper, valueMapper): 將每個組的元素收集到一個Map中,需要指定key和value的映射規則。
- Collectors.averagingInt(ToIntFunction) / averagingLong(ToLongFunction) / averagingDouble(ToDoubleFunction): 計算每個組的平均值。
- Collectors.summingInt(ToIntFunction) / summingLong(ToLongFunction) / summingDouble(ToDoubleFunction): 計算每個組的總和。
- Collectors.maxBy(Comparator) / minBy(Comparator): 找出每個組的最大值/最小值。
- Collectors.reducing(identity, op): 對每個組的元素進行歸約操作。
- Collectors.collectingAndThen(downstream, finisher): 對下游的Collector的結果進行進一步的處理。
例如,我們想按照年齡分組,然后找出每個年齡段年齡最大的人:
Map<Integer, Optional<Person>> oldestByAge = people.stream() .collect(Collectors.groupingBy(Person::getAge, Collectors.maxBy(Comparator.comparingInt(Person::getAge)))); System.out.println(oldestByAge); // 輸出:{25=Optional[Person{name='Charlie', age=25}], 30=Optional[Person{name='David', age=30}], 35=Optional[Person{name='Eve', age=35}]}
在這個例子中,我們使用了Collectors.maxBy(Comparator.comparingInt(Person::getAge))作為下游的Collector,它會找出每個年齡段年齡最大的人。注意,由于可能某個年齡段沒有人,所以返回的是Optional。
總之,groupingBy的靈活性在于可以搭配各種不同的Collector,根據不同的需求對分組后的數據進行各種各樣的處理。