Group Anagrams
- leetcode: Group Anagrams
- lintcode:
Given an array of strings, group anagrams together.
For example, given: ["eat", "tea", "tan", "ate", "nat", "bat"]
,
Return:
Note: All inputs will be in lower-case.
Python
class Solution:
# @param strs: A list of strings
# @return: A list of strings
# @return: A list of strings
def anagrams(self, strs):
if len(strs) < 2 :
return strs
result=[]
visited=[False]*len(strs)
for index1,s1 in enumerate(strs):
hasAnagrams = False
for index2,s2 in enumerate(strs):
if index2 > index1 and not visited[index2] and self.isAnagrams(s1,s2):
result.append(s2)
hasAnagrams = True
if not visited[index1] and hasAnagrams:
result.append(s1)
return result
def isAnagrams(self, str1, str2):
if sorted (str1) == sorted(str2):
return False
C++
- strs 长度小于等于1时直接返回。
- 使用与 strs 等长的布尔数组表示其中的字符串是否被添加到最终的返回结果中。
- 双重循环遍历字符串数组,注意去重即可。
- 私有方法
isAnagrams
用于判断两个字符串是否互为变位词。
复杂度分析
私有方法isAnagrams
最坏的时间复杂度为 O(2L), 其中 L 为字符串长度。双重for
循环时间复杂度近似为 \frac {1}{2} O(n^2), n 为给定字符串数组数目。总的时间复杂度近似为 O(n^2 L). 使用了Vector String “visited”,空间复杂度可认为是 O(n).
在题 中曾介绍过使用排序和 hashmap 两种方法判断变位词。这里我们将这两种方法同时引入!只不过此时的 hashmap 的 key 为字符串,value 为该字符串在 vector 中出现的次数。两次遍历字符串数组,第一次遍历求得排序后的字符串数量,第二次遍历将排序后相同的字符串取出放入最终结果中。
leetcode 上此题的 signature 已经更新,需要将 anagrams 按组输出,稍微麻烦一点点。
Python lintcode
class Solution:
# @param strs: A list of strings
# @return: A list of strings
# @return: A list of strings
def anagrams(self, strs):
strDict={}
result=[]
for string in strs:
if "".join(sorted(string)) not in strDict.keys():
strDict["".join(sorted(string))] = 1
else:
strDict["".join(sorted(string))] += 1
for string in strs:
if strDict["".join(sorted(string))] >1:
result.append(string)
return result
Java - leetcode
public class Solution {
public List<List<String>> groupAnagrams(String[] strs) {
if (strs == null) return result;
// one key to multiple value multiMap
for (String str : strs) {
char[] strChar = str.toCharArray();
Arrays.sort(strChar);
String strSorted = String.valueOf(strChar);
if (multiMap.containsKey(strSorted)) {
ArrayList<String> aList = multiMap.get(strSorted);
aList.add(str);
multiMap.put(strSorted, aList);
} else {
ArrayList<String> aList = new ArrayList<String>();
aList.add(str);
multiMap.put(strSorted, aList);
}
}
// add List group to result
Set<String> keySet = multiMap.keySet();
for (String key : keySet) {
ArrayList<String> aList = multiMap.get(key);
Collections.sort(aList);
result.add(aList);
}
return result;
}
}
源码分析
第一次遍历字符串数组获得排序后的字符串计数器信息,第二次遍历字符串数组将哈希表中计数器值大于1的字符串取出。
leetcode 中题目 signature 已经有所变化,这里使用一对多的 HashMap 较为合适,使用 ArrayList
遍历一次字符串数组,复杂度为 O(n), 对单个字符串排序复杂度近似为 O(L \log L). 两次遍历字符串数组,故总的时间复杂度近似为 O(nL \log L). 使用了哈希表,空间复杂度为 O(K), 其中 K 为排序后不同的字符串个数。
- [^unordered_map]:
- Anagrams | 九章算法